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PRESENTACION 


Gracias a la generosidad de profesores y estudiantes que lo han preferido como texto o como fuente de 
consulta, se ofrece esta nueva Edicion, con nueva presentacion mucho mas comoda y facil de manejar, 
con una revision y actualizacion de los contenidos, asi como de estilo, que esperamos sea del agrado de 
todos aquellos que de alguna manera tendran la oportunidad de consultarla. 

En esta decima tercera edicion se suprimieron algunos temas que han perdido vigencia en los progra- 
mas, en contraprestacion se incluyeron y mejoraron otros, manteniendo las exigencias y la actualizacion 
en la ensenanza de esta materia de acuerdo a los diferentes niveles, asi como en los objetivos que se 
exigen en las carreras intermedias y profesionales. En esta ocasion se ha suprimido el CD que siempre 
lo acompanaba, ahora se ofrece la consulta a la Pagina web www.ecoeediciones.com donde encontrara 
entre otros, a) Proceso continuado de la aplicacion del Excel en todos los temas de esta publicacion. b) 
Solucionario con todo el proceso que conlleva el desarrollo de los problemas propuestos, c) Ademas 
incluye un tema que fue suprimido pero que lo seguimos considerandolo importante en proceso integral 
del conocimiento de esta materia, como son la Sumatoria, Productoria, y el uso de los Porcentajes, Tasas 
y Razones 

El objetivo principal y la razon de esta publicacion sigue siendo el estudiante, a fin de facilitarle el 
aprendizaje de esta valiosa herramienta, de ahi la equivocacion de algunos que la consideran “elemen¬ 
tal”, comentarios que nos alegra, pues no esta dirigido a profesionales de la Estadistica con grandes 
conocimientos matematicos, por el contrario se pretende ayudar a aquellos que apenas se inician en 
esta disciplina, eliminando procesos que no solo dificultan su aprendizaje, que de alguna manera hacen 
perder el interes sobre aquellos temas que tienen gran importancia en su aplicacion en tantos campos del 
conocimiento. 

Creo firmemente que los contenidos de esta publicacion van a ser un valioso apoyo, para quienes creen 
que los programas de computador la han desplazado, este ultimo solo permite observar la base de datos 
en su conjunto y los resultados obtenidos que son los requeridos, pero elimina los procedimientos que 
fueron aplicados para su obtencion. 

Sea la oportunidad para manifestar nuevamente, mis mas sinceros agradecimientos a profesores y 
estudiantes que me han hecho llegar comentarios, criticos algunos, que han sido de gran ayuda al mejora- 
miento de los contenidos en cada edicion, como aquellos que reconocen esta labor, lo que me da aliento 
para seguir en esta tarea de divulgacion. 


El Autor. 
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ASPECTOS GENERALES 

RESENA HISTORICA 

La estadistica que muchos la consideran como algo nuevo, dado que hoy en dia todo se fundamenta en 
el manejo de grandes cantidades de informacion o datos de caracter estadisticos, pero su aplicacion o 
uso se remonta a la antiguedad, pues hay vestigios de su inicio como en China donde el emperador Yao 
(2.239 A de C.) dispuso la realizacion de un Censo; algo similar ocurrio en la epoca del Rey Herodes, 
relacionado con un empadronamiento cuando se hablo del nacimiento de Jesus. 

La estadistica como disciplina, tuvo su inicio en Alemania a mediados del Siglo XVII, en el reinado 
de Godofredo de Achewall (1.719-1.772) se utilizo la palabra estadistica y se separo de la Sociologia. 
Hoy en dia ha alcanzado un alto desarrollo, con el apoyo de tantos investigadores dedicados a perfec- 
cionar metodos estadisticos y a traves del avance tecnologico, permitiendo la seleccion de aquellos pro- 
cedimientos que buscan mejorar los resultados, al mismo tiempo disminuyendo los margenes de error. 

La palabra estadistica, para algunos, proviene de la palabra status, que significa estado; para otros 
se deriva del vocablo griego statera que significa balanza, otra mas confiable proviene de la palabra ale- 
mana Stara que significa estado, la encargada de hacer estadisticas. 

APLICACION DE LA ESTADISTICA 

En la vida diaria, los diversos fenomenos de orden economico, social, politico, educacional e incluso 
biologico, aparecen, se transforman y finalmente desaparecen. 

Para tan abundante y complejo material informativo recogido, se hace necesario contar con un 
registro ordenado y continuo, a fin de determinar o seleccionar los datos requeridos por el estudio o in- 
vestigacion, en cuanto a lo sucedido, sucede o puede suceder. Para ello se requiere contar con un metodo 
o conjunto de reglas o principios, que nos permita la observacion, el ordenamiento, la cuantificacion y el 
analisis de dichos fenomenos. Este metodo se le denomina Estadistica. 


La palabra estadistica se refiere a un sistema o metodo usado en la recoleccion, 
organizacion, analisis y descripcion numerica de la informacion. Tambien se puede 
decir que la estadistica estudia el comportamiento de hechos o fenomenos de grupo. 


Se consideran dos fases en el campo de la estadistica. En primer lugar, esta la fase que solo se limita 
a la descripcion de un conjunto de datos sin llegar a conclusiones o a generalizar con respecto a un grupo 
mayor. A esta fase se le da el nombre de EStadlStica D escriptiva 0 D eductiva. En la segunda, ella implica 
el analisis mediante la cual trata de llegar a conclusiones acerca de un grupo mas grande o poblacion, 
basado en la informacion de un grupo menor o muestra, procedimiento o tecnica denominada como E S- 
tadistica Inductiva o Inferencia. 

En un principio se consideraba que la funcion primordial de la EStadlStica , era la descripcion de las 
caracteristicas de un grupo, actividad que la hacia confundir con el papel que cumple la historia, consis- 
tente en observar y describir el hecho. En su origen, las estadisticas eran historicas; hoy en dia, la esta¬ 
distica, ademas de ser descriptiva, es analitica, considerandose esta como la funcion mas importante que 
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ella realiza, ya que ademas, permite obtener conclusiones para un grupo mayor, denominado poblacion, 
partiendo de una investigacion realizada en un grupo menor, conocido como muestra, cuyos elementos 
o unidades, en la mayoria de los casos, se seleccionan aleatoriamente o al azar. 

La estadistica descriptiva 0 deductiva , tiene como finalidad, colocar en evidencia aspectos caracte- 
risticos del grupo (promedios, variabilidad de los datos, etc.) que sirven para realizar comparaciones, sin 
pretender sacar conclusiones de tipo mas general. Esta descripcion, por lo general se realiza a traves de la 
elaboracion de cuadros, graficos, calculo de promedios, proporciones, varianzas de una o mas variables 
relacionadas. 

La estadistica analltica 0 inductiva , busca dar explicaciones al comportamiento de un conjunto de 
observaciones, probar la significacion o validez de los resultados, ademas, intenta descubrir las causas 
que lo originan, siendo de gran aplicacion en el muestreo, logrando de esta manera, obtener conclusiones 
que se extienden mas alia de las muestras estadisticas mismas. 

Uno de los objetivos principales de la estadistica , consiste en realizar inferencias acerca de los valo- 
res estadisticos de la poblacion, denominados parametros, a traves de la informacion obtenida mediante 
una muestra, que nos permite el calculo de estimadores. 


La estadistica descriptiva-analltica , se podria definir: como un conjunto sistematico 
de procedimientos utilizados para observar y describir numericamente un fenomeno, 
ademas, descubrir las leyes que regulan la aparicion, transformacion y desaparicion 
de los mismos. 


Tambien se puede considerar la estadistica , como aquel metodo que permite no solo describir el 
hecho o fenomeno, sino tambien, que permite deducir, evaluar y sacar conclusiones acerca de una pobla¬ 
cion, con los resultados obtenidos a traves de una muestra. 

Generalmente asociamos la estadistica con cifras sobre un campo en particular. Como por ejemplo: 
el numero de nacimientos, defunciones, transacciones comerciales, valor de las acciones en el mercado 
de valores, volumen fisico y monetario de las importaciones y exportaciones, beneficios y utilidades de 
las empresas, demanda presente o potencial de algun producto. 


E stadisticas (en plural). Se refiere a un ordenamiento sistematico de datos, presentados 
en forma de tablas o cuadros y graficas. En otras palabras, las estadisticas son 
datos agrupados en forma metodica y presentados en publicaciones, elaboradas por 
diversas empresas o entidades privadas o del estado, buscando ser consultadas por 
los interesados. 


Se clasifican en: 

Estadisticas 0 fuentes primarias. Son datos obtenidos mediante encuestas directas, a traves de la 
utilizacion de cuestionarios o como resultado de la observacion directa, tecnica muy utilizada en estudios 
de caracter cientifico o en investigaciones de mercados. Se podra decir, que son datos publicados por 
quien recoge directamente la informacion primaria. 
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Estas podrian clasificarse en: personates (entrevistas, correo, experimentos, etc.); unipersonales 
(auditoria, analisis de rastreo o de contenido, simulacion); mixta (observaciones). 

Estadisticas 0 fuentes secundarias. En estas, los datos se obtienen de publicaciones, las cuales 
podran ser reproducidas en forma total o parcial. Se les considera de gran valor para cualquier tipo de 
investigacion. Son consideradas como fuentes secundarias: bibliotecas, centros de documentacion, fo- 
lletos, revistas, archivos, etc. 

Estadisticas 0 series temporales. Generalmente denominadas como series de tiempo o cronologi- 
cas. La informacion es obtenida y ordenada en forma cronologica, a medida que se va produciendo a tra- 
ves del tiempo, ya sean dias, meses, semestres, anos. Cuando la investigaciones se realizan aisladamente, 
no periodicas, se les denomina: investigaciones atemporales 0 aisladas. 

Las estadisticas, tambien se pueden clasificar como internas 0 externas. Las primeras se originan 
y se elaboran en la misma fuente de informacion, por ejemplo en una empresa, son registros intemos, 
tales como: la produccion y ventas diarias, semanales, etc. salarios, horas trabajadas, etc. Las externas, 
son registros de informacion originados fuera de la empresa: opinion de los consumidores, precios de la 
competencia, etc. 

Clases de estadisticas. Se clasifican de acuerdo con el tema, sector o materia de estudios, asi por 
ejemplo: estadisticas industriales, agropecuarias, de transporte, comunicaciones, salud, educacion, etc. 

EstadlStico. Nos referimos a la persona que trabaja en la elaboracion y analisis de informacion de 
caracter estadistico. En nuestro medio utilizamos el termino estadigrafo, para referirnos a esa persona, 
cuando en realidad su significado es el de una medida estadistica. 

FINALIDAD DE LA ESTADISTICA 

En terminos generates, se considera que su finalidad es suministrar informacion y su utilidad dependera en 
gran parte del fin que se proponga y de la forma como se obtengan los datos. La creciente especializacion 
lograda por las empresas, ha obligado a la utilizacion continua de metodos estadisticos, como en la 
produccion masiva, en el control de calidad, en este ultimo, evitando la inspeccion de cada articulo y 
reemplazado por seleccion de muestras. Por ejemplo, en el control realizado sobre dureza, resistencia y 
duracion, que por lo general implica la destruccion del articulo, lo cual hace necesario la aplicacion de 
las tecnicas de muestreo, a fin de reducir su numero, como forma de obtener conclusiones que puedan 
ser extensivas al total de la produccion de la cual se extrajo la muestra. 

Otras aplicaciones que se pueden hacer, son las investigaciones realizadas con el objeto de cono- 
cer los cambios en los gastos o gustos de los consumidores, situaciones en la demanda: exceso en las 
existencias; capacidad de compra en un grupo familiar. Precisando sobre la finalidad de la estadistica, 
podriamos mencionar: 

□ Conocer la realidad en una observacion o fenomeno. Al cuantificarlo, estamos conociendo 
su situacion actual, es asi como al tener informacion por horas, semanalmente, etc. sobre la 
produccion de un articulo, se sabra si se esta cumpliendo con lo programado o, si por el contrario, 
estamos por debajo o por encima de lo establecido, pues ello afectara de alguna manera las 
existencias del producto o de la materia prima, ventas, precios, costos, etc. 
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□ Determinar lo tipico o normal de esa observacion. Cuando se cuantifica la caracteristica 
de un fenomeno, se obtiene un valor denominado promedio , es esta la forma de referirnos al 
grupo cuantificando asi su comportamiento. Si decimos que el promedio de unidades vendidas 
de un articulo A, en 20 almacenes, en el mes de marzo fue de 1.200 unidades, es una forma de 
determinar el comportamiento del grupo; pero con este valor tipico o normal del conjunto no se 
quiere decir que los 20 almacenes vendieron la misma cantidad; posiblemente algunos mas, otros 
menos, pero el promedio fue de 1.200. 

□ D eterminar los Cambios que presenta el fenomeno. Cualquier fenomeno de caracter estadistico 
presenta variaciones a traves del tiempo, pero requiere una observacion continua para poder 
determinar la magnitud del cambio. La demanda, la produccion, las ventas, los precios, son 
fenomenos que constantemente registran cambios que deben ser tenidos en cuenta por la 
administracion de una empresa. 

□ R elacionar dos 0 mas fenomenos. Desde el punto de vista de correlacion, se puede determinar si 
existe una relacion valida entre dos o mas caracteristicas de una misma observacion, o entre dos 
o mas fenomenos. Tal es el caso de la relacion de ingresos y gastos para un grupo de familias o 
la relacion entre las unidades producidas, vendidas y el precio. 

□ Determinar las causas que originan el fenomeno. Los cambios que se observan en un fenomeno 
pueden tener una o varias causas de origen. El aumento de las exportaciones de un articulo 
puede ser causado por un mejoramiento del precio en el mercado extemo, por un volumen 
de produccion superior a la demanda interna, o por otras causas que producen cambios en el 
comportamiento del fenomeno. 

□ Hacer estimativos sobre el comportamiento futuro del fenomeno. En numerosas ocasiones se 
requiere proyectar, para estimar el comportamiento futuro de un fenomeno. La proyeccion a dos 
o tres anos de la poblacion de una region, sirve para determinar el mercado potencial del producto, 
es decir, el conocimiento, aunque sea estimado, de la demanda en los anos proximos. 

□ Obtener conclusiones de un grupo menor (muestra), para hacerlas extensivas a un grupo 
mayor (poblacion). Al realizar mediciones en una muestra, cuyo tamano debe ser el optimo 
deseado, los resultados obtenidos pueden ser considerados como el comportamiento que se 
obtendra si se hubiera trabajado con todos los elementos que constituyen la poblacion, de la 
cual se extrajo la muestra. 

Ademas de lo anterior, la estadistica facilitauna serie de instrumentos o tecnicas que, al serutilizadas 

correctamente, permiten determinar el grado de validez y confiabilidad, ya sea de las predicciones o 

de las conclusiones obtenidas a partir de muestras. 

COLECTIVOS INVESTIGADOS POR LA ESTADISTICA 

La conformacion de un grupo o colectivo alrededor de cierta caracteristica, o caracteristicas, que permiten 
ser investigadas en cuanto a su comportamiento, se denomina fenomeno. Los fenomenos pueden ser de 
caracter economico, social, politico, u otros, considerando como tales: exportaciones, importaciones, 
ventas, produccion, defunciones, nacimientos, accidentes laborales, etc. 

Los fenomenos de caracter estadistico deben reunir ciertos requisitos, como manifestarse a I exte¬ 
rior para poder ser observados , lo cual se logra mediante registros. Se consideran como ejemplos: las 
nominas de pago, donde quedan consignados el numero de empleados, las categorias, sueldos y otras 
tantas caracteristicas que podrian ser observadas; los manifiestos de aduana, en donde se registran, tanto 
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las importaciones como las exportaciones; las licencias de construction concedidas por las Secretarias 
de Obras Publicas; los registros de nacimientos, defunciones, escrituras de venta, hipotecas, todas ellas 
realizadas en las Notarias, etc. Ademas, las caracteristicas de estos fenomenos deben ser cuantificables 
en tal forma que permitan determinar la intensidad con que se producen. Un ejemplo clarifica mejor lo 
anterior: si consideramos las exportaciones de cafe realizadas por las diferentes firmas exportadoras en 
un periodo determinado, encontramos que se trata de un fenomeno que se manifiesta al exterior y que 
se puede observar en los registros de exportacion, y por otra parte, se cuantifica el numero y valor de las 
remesas realizadas, ademas se podra obtener la intensidad o sea la cantidad de sacos o kilos correspon- 
dientes a cada remesa o al total exportado en dicho periodo. 

Fuera de las anteriores condiciones implicitas en un fenomeno estadistico, podemos anotar otras 
que se consideran dentro del campo de estudio de la estadistica: 

□ C olectivos. La estadistica estudia el comportamiento de los fenomenos de grupo, prescindiendo 
de aquellos fenomenos individuales que pueden ser considerados como resultados de 
casos aislados. Si bien es cierto que para estudiar el colectivo se requiere informacion 
individualizada, las conclusiones que se obtienen de la investigacion no se refieren a cada 
elemento individualmente, sino al conjunto de los elementos considerados como grupo. 

□ F recuente repeticion. Aquellos fenomenos que se presentan una vez y no vuelven a repetirse 
en las mismas condiciones, no son estudiados por la estadistica. Por el contrario, se requiere 
que el fenomeno sea de frecuente repeticion. Tal es el caso de las transacciones comerciales, 
inventarios, accidentes de trabajo, nacimientos, etc. 

□ D istinta frecuencia. Si observamos las ventas realizadas por un almacen, encontramos que se trata 
de un fenomeno de distinta frecuencia, porque de lunes a sabado se repite dicha operacion, pero 
el valor de esas ventas varian de un dia a otro, de semana a semana o de mes a mes, dependiendo 
del periodo examinado. Si el fenomeno tiene la misma frecuencia, no requerira de la estadistica, 
pues basta su registro una sola vez y se tendra igual informacion en cada periodo. 

□ M anifestarse al exterior. El contrabando, el cultivo y comercio de la marihuana, las 
transacciones en dolares en el mercado negro, son fenomenos que diariamente se suceden 
pero no son registrados. Por lo tanto, se dice que no se manifiestan al exterior para ser 
observados estadisticamente. 

□ D istantes en el tiempo. Las ventas, en cierta cantidad, de determinados articulos estacionales, 
tales como polvora, juguetes, articulos para celebrar el dia de la secretaria, la primera 
comunion o la recoleccion de un determinado producto agricola, son fenomenos que no se 
suceden todos los dias. Por el contrario, se producen en una determinada epoca o fecha y hay 
que esperar cierto tiempo para que se presente nuevamente. 

□ Distantes en el espacio. El pago de cheques por el Banco Comercial, es un fenomeno que 
podemos observar en diferentes sitios, en las sucursales que tiene en una ciudad, en todo el 
departamento o en todo el pais. Las exportaciones e importaciones que se realizan por los 
diferentes puertos del pais. Son ejemplos que muestran al fenomeno originado en diferentes 
sitios, sin ser indispensable que se presente en un mismo lugar. 

□ Cualitativos que pueden cuantificarse. Algunas caracteristicas cualitativas investigadas, 
requieren ser cuantificadas para que sean consideradas dentro del campo estadistico. Sin 
embargo no todas son cuantificables, tales como el grado de religiosidad, la moral y tantas 
otras y por tal razon quedan fuera de la accion estadistica. Son ejemplos de hechos cualitativos, 
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los elementos clasificados por: sexo, estado civil, profesion, ocupacion, primaria, secundaria, 
universitaria, por nacionalidad, mes de nacimiento, colores, etc. 

□ A quel los fenomenos que son accidents I es, tanto en el tiempo como en el espacio, no son 
propios de la investigacion estadistica, se presentan una sola vez y no vuelven a ocurrir. 

ALGUNOS TERMINOS Y CONCERTOS 
QUE SE DEBEN CONOCER Y MANEJAR 

A continuacion se definen en forma sencilla y facil de entender, algunos terminos que seran utilizados en 
el desarrollo de los diferentes capitulos, en los cuales se ha dividido este libro. 

\hle la pena recalcar la importancia del conocimiento y el manejo de los terminos que a continua¬ 
cion se expondran, ya que nos permitira hablar un solo lenguaje, precisar lo que se va a hacer y entender su 
uso en los diversos aspectos que conlleva el desarrollo de los temas del presente libro. Se recomienda leer 
detenidamente las primeras paginas de los capitulos 7 y 13, donde encontrara mas information que le ayude a 
comprender mejor estos terminos. 

Poblacion. Es un conjunto de medidas o el recuento de todos los elementos que presentan una ca- 
racteristica comun. El termino poblacion se usa para denotar el conjunto de elementos del cual se extrae 
la muestra. 

Lo ideal seria, que el numero de elementos o unidades de observacion que constituyen la muestra, 
denominada tambien poblacion por muestrear o poblacion muestreada, fuera igual al contenido total en 
la poblacion o poblacion objetivo. Pero comono ocurre asi, las conclusiones consideradas validas para la 
muestra pueden ser extendidas a la poblacion, garantizandolas estadisticamente mediante la indicacion 
de la validez del proceso. 

Los elementos o unidades que integran la poblacion o la muestra pueden corresponder a personas 
objetos o cosas. Ademas, el elemento puede ser una entidad simple (una persona) o una entidad compleja 
(una familia) que se denomina unidad , la que, a su vez, puede estar compuesta de elementos o de unidades, 
que en algunos casos se les define como conglomerados. 

Segun sea el numero de elementos, la poblacion puede considerarse como finita o infinita. Es una 
poblacion finita cuando el numero de elementos que la compone es limitado; infinita cuando consta de 
ilimitado numero de elementos. Sin embargo, algunas veces, una poblacion finita con un numero grande 
de elementos, el comportamiento en el calculo del tamano de muestra resulta igual al de una poblacion 
infinita, ya que existe un tamano muestral optimo tal que, a partir de un determinado valor calculado, este 
no se altera por mas que aumente el tamano poblacional. 

Marco : se denomina marco, marco muestral o marco de referenda , a la lista, mapa o cualquier 
otro material aceptable, que contenga todas las unidades o elementos perfectamente identificados y 
actualizados, donde se selecciona la muestra. 

C aracteristicas: es importante resaltar el hecho de que a pesar de encontrarse una poblacion cons- 
tituida por un grupo de elementos o unidades, a la estadistica no le interesa el elemento o la unidad en si, 
sino sus caracteristicas. 
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Estos son algunos ejemplos de lo que podrlan denominarse elementos de una poblacion y caracte¬ 
risticas de la misma: 


ELEMENTOS 

CARACTERfSTICAS 

Personas 

Salarios 

Personas 

Horas trabajadas 

Personas 

Cargos 

Departamentos 

\bntas 

Hogar 

Consumo 


Las caracteristicas (o caracteres). Corresponden a ciertos rasgos, cualidades o propiedades que 
poseen los elementos que constituyen la poblacion o la muestra. 

Algunos caracteres son mensurables y se describen numericamente; por tal motivo se denominan 
caracteres CUantitat'lVOS o variables , tales como: estatura, peso, ingreso, valor, produccion, ventas, etc. 
Otros se expresan mediante palabras por no ser mensurables pero si cuantificables, tales como: profe- 
sion, cargo, marcas, calidad, etc. y se denominan caracteres cualitativos 0 atribiltOS. 

Las variables o aspectos cuantitativos se clasifican en: variables discretas y continuas. La primera 
se refiere a aquella que solo puede tomar unos determinados valores, siendo imposible que llegue a to- 
mar valores intermedios entre dos consecutivos, es decir, toma unicamente valores enteros: 1, 2, 3 etc., 
tal es el caso del numero de hijos por familia, nunca se tendra 2 hijos y medio o dos hijos y cuarto, etc. 
En el segundo, se toman todos los valores infinitos posibles en un intervalo, es decir, se admiten valores 
fraccionarios, como el numero de anos de una persona: 20 anos, tres meses, cinco dias etc. La distincion 
que generalmente se hace entre variables discretas y continuas es mas teorica que practica, pues en 
la practica se podra decir que todas las variables son discretas, pero dada la facilidad de agruparlos en 
intervalos, como por ejemplo: edades entre 6 y 10 anos, mas de 10 y 20 anos y asi sucesivamente hacen 
realidad esa distincion. 

Si analizamos o describimos una caracteristica (atributo o variable) en forma independiente nos 
referiremos a distribuciones unidimensionales o univariante. Si relacionamos dos caracteristicas entre 
si (variables; variable y atributo; o dos atributos) nos referimos a distribuciones bidimensionales o biva- 
riante. En el caso de relacionar mas de dos caracteristicas se dira que la distribucion es pluridimensional 
o multivariante. 

Investigacion total. Denominada tambien como censo o investigacion exhaustiva, es aquella en la 
cual se toma la totalidad de los elementos o unidades que conforman la poblacion objeto de estudio. 

No siempre se puede realizar una investigacion total, y debemos observar una parte de ellas, debido 
a circunstancias como las que se detallan a continuacion: 

□ Poblaciones muy grandes o infinitas. 

□ Tiempo requerido demasiado grande. 

□ C OStOS tan elevados que seria imposible con los recursos disponibles. 

□ R ecursos humanos con los que no se cuenta para el desarrollo de la investigacion. 

□ Destruccidn del elemento como ocurre en el control de calidad de un determinado producto, 
como por ejemplo, probar su resistencia o dureza. 
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□ H omogeneiddd de la caracteristica, como sucede en la preparacion de alimentos o en los 
examenes de laboratorio. 

M uestra 0 investigation partial. Se define como un conjunto de medidas o el recuento de una parte 
de los elementos pertenecientes a la poblacion. Los elementos se seleccionan aleatoriamente, es decir, 
todos los elementos que componen la poblacion tienen la mismaposibilidad de ser seleccionados. 

Para que una muestra sea representativa de la poblacion, se requiere que las unidades sean se/ecc/0- 
nadas al azar, ya sea utilizando metodos tales como: el sorteo, las tablas de numeros aleatorios, la selec¬ 
tion sistematica o cualquier otro metodo que sea al azar. 

Una muestra no probabilistica corresponde a la seleccion de las unidades o elementos, segun el 
criterio o conveniencia del investigador. En estos casos, algunas unidades tienen mayor posibilidad que 
otras de ser seleccionadas; por tal razon no se puede determinar la validez, ni la confianza que merecen 
dichos resultados. Casi por lo general, las unidades se seleccionan en forma caprichosa, voluntaria , por 
cuotas, tal como sucede en las encuestas de opinion, que en la mayoria de los casos no tienen credibili- 
dad, de ahi que se le conozca como M uestra circunstancial o erratica. 

Podemos concluir, en forma resumida, mediante un esquema, que la observacion de una poblacion 
se puede hacer de diferentes maneras, tal como se presenta a continuacion. Este tema se amplia en los 
capitulos 7 y 13, por lo tanto se recomienda consultarlo. 


Simple, 

Fstrati fi cad a 


Exhaustiva o total o censo 



Para metros. Son todas aquellas medidas que describen numericamente la caracteristica de una 
poblacion. Tambien se les denomina valor verdadero , ya que una caracteristica poblacional tendra un solo 
parametro (media, varianza, etc.). Sin embargo, una poblacion puede tener varias caracteristicas y, por 
tanto, varios parametros. Algunos lo denominan como valor estadistico de la poblacion. 

Estimador o Estadigrafo. La descripcion numerica de una caracteristica correspondiente a los 
elementos de una muestra , se denomina estadigrafo. De una poblacion se pueden obtener (M) numero 
de muestras posibles y en cada una de ellas se puede cuantificar la caracteristica, obteniendose por lo 
general, valores diferentes para cada muestra, a pesar de ser utilizado el mismo estadigrafo o medida. 

Tambien se le conoce como Estimador Puntual si se trata de un promedio , varianza , proportion , 
etc. Como por lo general, existe una diferencia entre el estimador y el parametro, denominado error, es 
aconsejable utilizar el estimador por intervalos, dentro del cual debera estar contenido el parametro con 
cierto margen de seguridad, establecido por el investigador. 

La diferencia entre el estimador y el parametro , como ya se dijo, se le denomina como error de 
muestreo, y lo fija el investigador para determinar el tamano de la muestra, con base en la experiencia y 
el conocimiento que tenga sobre el comportamiento y la variacion que tenga la caracteristica o caracteris¬ 
ticas principales relacionados con el objetivo mismo de la investigacion. 
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Errores ajenos a I muestreo : no son cuantificables (como el anterior) y son resultados de errores 
sistematicos que se producen a lo largo de la investigacion, como: en la preparacion, formulacion, reco- 
pilacion presentacion, entre otras. 


LA PROYECCION Y PREPARACION DE 
INVESTIGACIONES ESTADISTICAS 


En nuestro diario quehacer profesional, en la mayoria de las casos, nos corresponde analizar informacion 
estadistica para la toma de decision en el desarrollo de nuestro trabajo y gran parte del libro trata de 
colaborar con el lector, presentando tecnicas que les permitan hacerlo, en gran manera acertada; pero 
otras veces, no pocas, hay necesidad de realizar la investigacion a fin de obtener los datos necesarios. 

El metodo estadistico permite recolectar u observar mediante registros, que se ordenan, clasifican, 
cuantifican y presentan mediante cuadros, graficas, permitiendo la depuracion de datos en dos aspectos, 
en su presentacion clara y en su simplificacion, ya que deesta manera facilita manejar grandes cantidades de 
informacion presentadas en forma resumida, tarea que realizamos a traves de la estadistica descriptiva; 
luego la inferencia estadistica permite el analisis y la busqueda de relaciones que puede existir entre ellas 
ya que trabajamos sobre abstracciones, situacion muy diferente comparada con el metodo experimental 
que descansa sobre realidades fisicas. 

Algunos problemas que nos planteamos en la vida diaria, tendran contestacion a traves del analisis 
de los datos que se han registrado, a medida que se producen en un estricto orden cronologico: precios, 
ventas, accidentes, exportaciones, inventarios al finalizar el ano, etc. Cuando no existen esos registros 
es necesario la realizacion de encuestas, ya sea tomando toda la poblacion (censo) o una parte de ella 
(muestra) para deducir el comportamiento de las caracteristicas de la totalidad de la poblacion. En este 
caso podemos considerar algunas etapas, no necesariamente todas, que deben ser tenidas en cuenta para 
su desarrollo. 


El proceso de elaboracion estadistica lo dividimos en seis 

(6) fases: 

A. 

Planeamiento o preparacion 

B. 

Recoleccion 

C. 

Critica y codificacion 

D. 

Procesamiento 

E. 

Analisis e interpretacion (numerico y grafico) 

F. 

Publicacion 


PLANEAMIENTO Y PREPARACION DE UNA INVESTIGACION 
DE TIPO ESTADISTICO 

Toda recoleccion de datos estadisticos de un hecho, requiere el establecimiento previo de un plan que 
detalle los aspectos que la investigacion va a abarcar, que flje los procedimientos a seguir, y que resuelva 
de antemano las posibles dificultades que se presume hayan de presentarse. 

La implantacion de una nueva informacion estadistica en una empresa privada u oficial o en un caso 
particular, exige el estudio y la redaccion de un proyecto al respecto. 

En general, un proyecto o plan de investigacion estadistica debe contemplar los 
siguientes aspectos: 








CAPfTULO UNO 

CONCEPTOSGENERALES 


11 


1) El objeto de la investigacion 

4) Los procedimientos 

2) La finalidad 

5) El material 

3) La fuente de informacion 

6) El costo y su financiacion 


El objeto de la investigacion 

Con el termino de objeto de la investigacion, nos referimos al hecho o fenomeno que vamos a observar 
y registrar numericamente. En una investigacion de salarios: el salario; en un censo de poblacion: los 
habitantes; en una estadistica industrial: la produccion, en una informacion de creditos: las operaciones 
crediticias. 


En el proyecto, al analizar que es o que vamos a investigar, nos proponemos: 

a) Definir el obj eto o finalidad de la investigacion 

b) Determinar su naturaleza cuantitativa y cualitativa 

c) Determinar la posibilidad de su investigacion, y 

d) Limitar el obj eto investigable 


El proyecto de una investigacion estadistica tiene que atender los fines que se persiguen con la 
investigacion, porque asi como sean estos, habran de ser los demas puntos del proyecto: la fuente de 
informacion, los procedimientos, el material y en consecuencia ultima, el presupuesto. 

Dos ejemplos, el uno bioestadistico y el otro economico, aclaran la necesidad de establecer, a priori, el 
punto de mira que se persigue con la recopilacion estadistica. 

Se organiza una estadistica de natalidad. Se puede aspirar a muy diferentes fines. Por ejemplo, se 
trata de conocer la proporcion de los sexos con un proposito biologico, o si no (y este es otro fin), con un 
proposito demografico de la poblacion que entra a la vida. En el supuesto, el fin nos obliga a preguntar por 
el sexo de los hijos nacidos, muertos o vivos; en segundo caso, nos bastara con indagar los nacidos vivos. 

Se prospecta una estadistica de salarios. El objetivo de esta investigacion, entre otros, puede ser, 
calcular el salario medio general simplemente, o bien obtener el salario mas frecuente en cada uno de los 
oficios de cierta rama industrial. 

a) Definir el objeto o finalidad de la investigacion: vamos a emprender un censo de edificios: ^que 
es un edificio para efectos de la recoleccion de los datos? En una investigacion de salarios: ^a 
que salarios nos referimos? En una investigacion industrial, ^que hemos de entender como 
“industria”, como “empresa”, como “fabrica”? 

^Indagaremos cualquier industria, toda clase de salarios, toda especie de edificios? o por el 
contrario, exigiremos determinados requisitos particulares? Lo anterior nos permite identificar 
A quien se investiga o sea el elemento o la unidad. \bamos algunas formas de definirlas: 

Uni dad de vivienda: “Es la unidad final considerada como una estructura separada e 
independiente destinada para alojar una o mas personas, con acceso directo a la calle, o a un 
pasillo o escalera, de tal forma que sus ocupantes puedan entrar o salir sin pasar por los cuartos 
de otras unidades de vivienda”. 
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H ogar : “Constituye la unidad final de observacion y se define como una o mas personas bajo la 
autoridad de un solo jefe que ocupan en comun la totalidad o parte de una vivienda y alimentos, 
a menos que circunstancias especiales lo impidan (por ejemplo el horario de trabajo) y no se 
aprovisionen conjuntamente de otros bienes y servicios de primera necesidad, sin interesar el 
parentesco entre ellos”. 

La primera cuestion por tanto, al tratar el objeto de la investigacion en una prospectacion 
estadistica, es la fijacion precisa del concepto de lo que se aspira a indagar. Decir con claridad y 
exactitud lo que la Estadistica va a recoger. La unidad o elemento de investigacion debe ser: 
clara , adecuada, mensurable y comparable. 

b) Determiner la naturaleza cuantitativa y cualitativa del objeto de la investigacion: o sea, 
establecer los aspectos cuantitativos del fenomeno que se pretende investigar y consecuencialmente 
pueden registrarse por medio de numeros, y otros que por ser cualitativos se han de recoger 
mediante anotaciones literarias, bien de su existencia o de su ausencia (si, no), bien de su clase o 
categoria (la, 2a, 3a), su origen (importacion de Estados Unidos, Inglaterra,Argentina), su destino 
(creditos a la agricultura, a la ganaderia, a la industria manufacturera), su marca (cafe brasilero, 
colombiano, mexicano), su grado de bondad (bueno, regular, malo), etc. 

c) Determinar la posibilidad de investigacion: de los aspectos establecidos en el considerando 
anterior, no basta conocer el objeto a investigar, y sus modalidades cuantitativas y cualitativas; se 
necesita examinar si una y otras pueden ser conocidas con precision, si se exteriorizan, si pueden 
contarse, si admiten su existencia y su intensidad. 

En un proyecto de estadistica sobre la morbilidad de una poblacion, ,como comprobaremos la 
presencia o la falta de la enfermedad?; el ahorro popular no depositado en cuentas de ahorros 
sino atesorado personalmente, ^como podremos conocerlo para registrarlo estadisticamente?; 
el alcoholismo en un barrio obrero, divisas extranjeras en las transacciones en la bolsa negra, la 
declaracion de las edades, los consumos familiares de viveres, los precios de las mercancias de 
importacion, se exteriorizan de alguna manera, constan en algun sitio, como para poder anotar 
el hecho en su cantidad o en su calidad o en ambos aspectos? 

d) Limitar el objeto investigable: conocemos lo que vamos a investigar, sus modalidades 
cualitativas y cuantitativas y la posibilidad de registrarlas. A continuacion, el proyecto tiene que 
delimitar la investigacion. Todo objeto a investigar en si, en el tiempo y en el espacio y a veces en 
el numero, debe tener sus meritos. 

Por imposibilidad practica o por ser innecesaria la observacion completa, la estadistica reduce 
sus trabajos a un doble aspecto: 

Primero: Limitando el objeto mismo de la investigacion y 
Segundo: Limitando el campo de la investigacion 

Limita el propio hecho o fenomeno que investiga, cuando se concreta a ciertos aspectos o 
modalidades, prescindiendo de todos los demas. Y ello por no serle posible abarcar todos los 
caracteres del fenomeno. 

Estadistica de salarios. Limita a las tasas de salarios en dinero, en los hombres de 18 anos o mas, 
en la industria de transformacion. Se prescinde de los salarios percibidos por el obrero en trabajo extra, 
por trabajos reducidos, primas de dias feriados, bonificaciones, etc.; se prescinde de las tasas de salarios en 
la agricultura y ganaderas; en la mineria y en los servicios se hace caso omiso de los salarios femeninos 
y de los masculinos, en los trabajadores menores de 18 anos. 
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Estadistica de creditos bancarios. Se limita a los prestamos y descuentos comerciales e industria- 
les que conceden los bancos. No se recogen los prestamos hipotecarios o de “amortizacion gradual”, se 
pregunta la clase de actividad economica, a que se destina, sobre si son personales o con garantia pren- 
daria, cuantia, interes o descuento y sus plazos de devolucion. Pero se dejan de indagar muchisimos otros 
aspectos de la empresa a la que se le concede el prestamo, del particular prestatario, del destino geografico, 
del capital prestado, etc. A1 admitir como necesarias unas caracteristicas del hecho que vamos a investi- 
gar y rechazar otras, el proyecto esta limitando al objeto mismo de la investigacion: los creditos bancarios, 
los salarios, en los ejemplos propuestos. 

La Estadistica puede interesarseporconocerlaproduccionalgodoneradelpais, pero no necesita ni le 
es posible llegar al detalle de los kilogramos recogidos en cada hacienda o region, le bastara con estimar 
aproximadamente las toneladas o incluso los miles de toneladas. La Estadistica nos proporciona el dato 
sobre la cotizacion de las monedas extranjeras hasta las milesimas o diezmilesimas del peso; aqui la 
aproximacion no puede ser mayor del tercero o cuarto decimal de la unidad monetaria. 

Segun la clase de investigacion de que se trate, la exactitud podra ser mayor o menor, y esta debera 
fijarse en el Proyecto de Investigacion. Es una forma de limitar el objeto de la recoleccion estadistica. 

Estudiamos ahora la limitacion del campo de la investigacion. Comprende cuatro aspectos: el espa- 
c/o, el tiempo , el numero de casos y la combinacion de los tres anteriores. 

Limitacion del espacio o cobertura geografica. Toda estadistica nacional presupone una limitacion 
geografica de orden intemacional. Una limitacion intemacional, e incluso mas de una estadistica munici¬ 
pal, esta circunscrita a determinados barrios del area urbana del municipio. Los censos nacionales, por 
su propia naturaleza, no estan limitados en el espacio nacional. Pero, por ejemplo, la estadistica sobre los 
indices de precios al consumidor, solo se realiza en un reducido numero de ciudades. 

Como siempre, la limitacion de este genero se efectua por falta de recursos para recoger los datos 
en todos los lugares, o por ser innecesaria la recopilacion completa para efectos de la observacion y cono- 
cimiento suficiente del fenomeno que investiga la estadistica. El proyecto ha de concretarse expresamente 
los lugares que va a contemplar la investigacion. 

Limitacion del tiempo. Tambien el tiempo se debe establecer; no todas las investigaciones pueden 
ser continuas; algunas se repiten, son periodicas; otras se celebran una vez en forma accidental y no vuel- 
ven a realizarse. En el proyecto se fija la continuidad, laperiodicidad o la accidentalidad de la investigacion. 
En los dos ultimos casos se trata de una limitacion del tiempo. 

El censo de poblacion, como los censos industriales o agricolas no se celebran todos los dias, ni 
todos los meses ni siquiera es necesario que sean anuales, basta y asi esta convenido intemacionalmente, 
que sean decenales. 

La criminalidad, por el contrario, tiene lugar en cualquier momento con caracteristicas muy variadas 
y su registro policial por otra parte es imprescindible. La estadistica de delitos, muy bien, podra ser con- 
tinua. La estadistica de mortalidad, como otras demograficas, debera ser permanente. 

Esta limitacion cronologica atemporal, se refiere a lo que en tecnica estadistica se denomina " el mo- 
mento estadistico" ; la epoca, la fecha de una investigacion. 
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Esta limitation, en la mayor o menor periodicidad, depende de la variabilidad del fenomeno que se 
investiga. A may ores modificaciones en el fenomeno, mas breve el tiempo transcurrido entre una y otra 
investigacion; los hechos de naturaleza estatica se investigan muy de tiempo (estado de las edificaciones, 
higienico, sanitario de la poblacion, caracteristicas de la industria, de la ganaderia, de las explotaciones 
agricolas, mineras, de la ensenanza); los hechos de grandes fluctuaciones se investigan en cortos interva¬ 
ls de tiempo (cotizaciones de bolsa, precios de viveres, nacimientos, produccion industrial, comercio 
exterior, costo de vida, ingresos y egresos del Estado, etc.). 

El proyecto dira el periodo o el caracter continuo o accidental de la investigacion. 

Limitation del numero de casos. La observacion, a veces, puede abarcar todos los casos que se 
presentan; en otras ocasiones no es posible, y por lo tanto, hay que limitar su numero. Los calculos y 
estimaciones estadisticas parten generalmente del estudio de un numero de observaciones. Asi se precede 
comunmente en las investigaciones cientificas de tipo medico, antropologico, economico, sanitario, social, 
etc. 


En la recoleccion de precios, no se hace de todos los articulos que se ofrecen y demandan en el merca- 
do, sino de un numero parcial de ellos; en la estadistica de los salarios se investiga a un grupo de obreros 
o empleados. 

El proyecto tambien tiene que fijar el numero exacto o aproximado de casos que deben indagarse. 

Limitation coordinada del espacio , del tiempo y del numero de casos: por ultimo y es lo que mas 
frecuentemente sucede, en un proyecto de investigacion estadistica hay que limitar a la vez, el espacio 
y el tiempo, aquel y el numero de casos, estos y el tiempo, o los tres juntos. 

Cuando en un proyecto se recomienda cualquiera de esas reducciones de la investigacion, se plan- 
tea el problema de la eleccion de la epoca, del lugar y de las propias unidades que sometemos al examen 
estadistico. 

Solo existe una norma general, para efectuar esas elecciones: los casos, los lugares y las epocas 
designadas deberan ser normales. No deberan encerrar caracteristicas, aspectos excesivamente intensos 
o excesivamente debiles del hecho o fenomeno de que se trate. 

Los procedimientos practicos son dos: 

Elegir al azar sin buscar intencionadamente los casos extremos, los lugares o las fechas en que el 
fenomeno presente una situacion anormal. 

Si se pretende realizar un analisis sobre las condiciones del trabajo en la industria manufacturera de 
un pais, y decidimos la investigacion, por ejemplo, a doscientas veinte fabricas y talleres, diez de cada 
departamento, efectuaremos una eleccion al azar; asi del Directorio de la Industria Manufacturera en- 
tresacamos de cada departamento las diez primeras empresas fabriles segun el orden alfabetico de sus 
razones sociales; probablemente, entraran pequenos talleres y grandes instalaciones, producciones muy 
diversas, condiciones de trabajo distintas, formas de asociacion de los propietarios, en fin, las mas variadas 
circunstancias y no empresas de igual naturaleza. 

Elegir por casos extremos, en los cuales el hecho social economico tiene intensidades maximas y 
minimas con el objeto de buscar lo normal en el punto medio de los limites extremos. 
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En el ejemplo anterior se pueden recoger las informaciones de la gran industria por un lado, y de la 
pequena por otro. De esta forma conoceremos los casos y situaciones extremas, y podremos de ellos de- 
ducir los valores y situaciones intermedias. Es una manera indirecta de hallar lo normal o tipico partiendo 
de lo anormal o atipico. 

Las fuentes de informacion 

Hasta ahora hemos analizado lo que se desea investigar y el por que de esa investigacion. 

A continuacion, es necesario preguntarse: ^donde es posible recoger alguna manifestacion exter¬ 
na del fenomeno economico?, ^en donde podremos registrar datos sobre los saldos de moneda depo- 
sitados en los bancos?, ^en donde cifras sobre importaciones?, ^en donde informacion sobre precios 
de viveres, etc.? 

El lugar, el documento, la oficina, la persona que constituye la fuente informativa podra ser: 

□ Directa e Indirecta 

Investigaciones directas e indirectas. Directamente recogemos datos de un acontecimiento de cual- 
quier indole, cuando acudimos a el, lo observamos y anotamos su presencia o su ausencia y su intensidad 
mediante un numero. Nos proponemos conocer el canje de cheques entre los bancos, acumulamos los 
cheques, los contamos en su numero, sumamos su valor y lo anotamos. Hemos observado y anotado 
directamente el mismo hecho cuyo conocimiento deseabamos. 

Indirectamente investigamos en estadistica, cuando se recurre a un hecho distinto del que nos intere- 
sa, para despues deducir de este el valor del que en definitiva deseabamos conocer. En estadistica agricola 
frecuentemente se emplea este procedimiento. Del rendimiento de determinada hectarea se deduce la 
produccion total. De la cosecha probable se deduce la siembra. 

De la transmision de herencias durante la vida media de un hombre en un pais, el capital y la renta 
nacional; de los consumos, la poblacion; de los precios del cafe hemos visto deducir estimativamente 
la importacion y el consumo de determinados articulos suntuarios. Son inducciones logicas, calculos 
aproximados, estimaciones que constantemente se realizan en los negocios. 

Se da el caso de que las cifras obtenidas indirectamente son mas necesarias y frecuentes en los 
paises de pequeno desarrollo estadistico por la misma falta de muchos renglones desconocidos. Y su 
proyeccion y aproximacion suficiente depende precisamente de la abundancia, extension y calidad de 
las estadisticas directas. Puesto que la garantia de esta clase de calculos se funda en varias pruebas por 
varias estadisticas directas. 

Se refieren sobre todo, a la investigacion de elevado costo que directamente no se puede realizar, 
las que por su naturaleza reservada, consumos de bebidas alcoholicas, vicios sociales, la pregunta directa 
se hace dificil. 

M uchas veces, se estima y Otras se calcula. Se estima subjetivamente cuando por ejemplo, un agro- 
nomo tasa la cosecha, valora las tierras. Se calcula objetivamente cuando, por ejemplo, el demografo 
nos da la cifra de habitantes en una fecha intermedia a dos censos directamente obtenidos; cuando los 
consumos de cierta poblacion se deducen de los consumos directamente investigados en un grupo parcial 
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de consumidores; cuando de las necesidades de materias primas de las grandes empresas se calcula la 
cantidad necesaria para todo un pais; por generalizacion de una parte al todo. 

Tambien, en caso de pasar a la intensidad de un hecho partiendo de la intensidad de otro; el con- 
sumo de came y leche a la poblacion; de la importacion de autos, a las necesidades de llantas; de la im¬ 
portacion y exportacion de libros, a la frecuencia de la lectura; del impuesto a la cerveza al consumo; de 
la pluviosidad a los precios, etc. Para que este calculo de resultados suficientemente buenos, se requiere 
imprescindiblemente que entre el hecho conocido y el desconocido exista una simple relacion, cierta 
proporcionalidad conocida o una dependencia de causa a efecto, de esta a aquella. 

Llamamos fuente de informacion estadistica directa alii donde el hecho economico se produce. Son 
ejemplos, el hogar de la familia obrera, para investigar sus consumos y el costo de su vivir; los peajes, 
para obtener los datos de la circulacion por carreteras; en las notarias para determinar el numero de na- 
cimientos, defunciones, matrimonios y otras informaciones estadisticas; los balances comerciales, para 
conocer los resultados de los ejercicios semestrales; el taller, para registrar el tiempo empleado en cada 
operacion productora. 

Son fuentes de informacion estadistica indirectd, aquellas donde el hecho se manifiesta indirec- 
tamente, en donde se refleja. Las rentas departamentales para determinar el consumo de bebidas alco- 
holicas; la policia para indagar datos sobre criminalidad; las listas o nominas de salarios para obtener 
informacion de las cesantias de estos; el degiiello del ganado para estimar la poblacion consumidora; los 
manifiestos de importacion y exportacion para averiguar el consumo interno. 

En el proyecto hay que fijar concretamente la fuente o fuentes de informacion que conviene o se 
necesita adoptar. 

Las mejores son las fuentes directas . Pero no siempre son posibles. Una estadistica de los delitos 
contra la propiedad no podria organizarse de forma que el registro estadistico se efectue en el lugar del 
robo. Necesariamente la fuente informativa ha de ser la comisaria o inspeccion de policia, donde el hecho 
se registra. 

De aqui nace la desconfianza sobre la estadistica, por la diferencia en los registros: una persona que ha 
sido atracada, violada, atropellada, etc., cree que denunciando el hecho no le representa ningun beneficio, 
solo perdera tiempo, de ahi que los resultados publicados no muestran la magnitud del problema, sino 
parte del mismo, lo cual origina la idea de que las estadisticas son mentirosas, en realidad se debe decir, que 
son deficientes, debido al no registro de lo que sucede. 

Cuando sea posible, debe emplearse una fuente directa. Cuando no, se empleara una indirecta. Fre- 
cuentemente estas se usan como complementarias de las primeras, y a efecto de establecer un control 
sobre las directas. 

Algunos autores clasifican la fuente de informacion como Primaria, cuando se obtiene directamente 
de la investigacion, realizada a traves de una encuesta, y Secundaria , cuando se trata de informacion 
complementaria, publicada por la misma institucion o cualquier otra. 

Tambien la clasifican en Interna cuando la informacion se produce dentro de la institucion, Externa 
en el caso de ser obtenida por fuera. 

La anterior clasificacion puede dar lugar a confusiones en cuanto a la denominacion de directa o 
indirecta. 
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Los procedimientos de investigation 

^Que caracteristicas debe reunir la investigation? ^bajo que formas haremos la recoleccion de los 
datos? 

En este aspecto del proyecto, comunmente los autores incluyen varios considerandos que se ajusta a 
estos interrogates: ^como investigaremos?, ^quien debe hacer la investigacion y por que sistema? 

^Como debe realizarse una investigacion? Es decir, ^cuales deben ser las normas generates y parti¬ 
culars de la estadistica que proyectamos? 


Suelen resumirse en estos puntos: 

• Claridad y publicidad. Toda la investigacion, en todos sus pormenores, debe ser 
tiara y conocida por todos los que vayan a intervenir: observadores y observados. 

La claridad se hermana con la comprension. La estadistica, primero en el periodo 
de investigacion, luego en el de elaboracion y mas tarde en presentacion y el 
analisis, debe ser entendida por todo el mundo: investigador, investigado, empleado 
que elabora los datos y el publico que va a leerlos y quiera utilizarlos. 

• Send 11 ez. Sencillez en todo. En los formularios, en las instrucciones, en el proyecto, 
en la finalidad, en los cuadros de exposicion, en los comentarios literarios de 
analisis, en las operaciones de calculo, en los graficos. La sencillez es conduccion 
esencial de la claridad; dificilmente se dara aquella sin esta. 

• Utilidad. Toda estadistica que se inicie debe tener alguna aplicacion practica de 
interes. De otro modo nos hallaremos ante una acumulacion molesta de datos que 
perjudicaran, por muchos motivos, a la informacion realmente aprovechable, a los 
negocios y a la politica economica de un pais. 


/,Cuando debera efectuarse la recopilacion estadistica? En el denominado “Momento Estadistico” 
Una estadistica podra ser Continua , periodica o aislada. En el primer caso, nada tenemos que decir res- 
pecto del momento estadistico apropiado, porque son todos. Es el caso de la estadistica de criminalidad, 
constantemente funcionan las comisarias de policia recogiendo los datos sobre los delitos que vayan 
denunciandose. 

Pero la mayoria de las estadisticas economicas y demograficas, son mas o menos periodicas, se 
producen en intervalos grandes o pequenos, segun el hecho de que se trate; es la cuestion del tiempo 
limitado. Se le denomina como series cronologicas o series de tiempo. 

Ahora se nos presenta el problema de elegir ese tiempo; el periodo, la duracion de la investigacion 
aislada y la fecha de esta o fechas de aquellos. 

Las investigaciones pueden ser, segun la clasificacion de Conrado Gini y de otros autores: ocasio- 
nal, periodica y continua. 

□ Es ocasional una recoleccion de datos en circunstancias extraordinarias, cuando eventualmente 
se presenta un problema, o se agita su solucion. Una investigacion del COStO de la Vl'da o de los 
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salarios cuando se plantea una huelga; cuando se denuncia el incumplimiento de la legislacion 
laboral; al discutirse reforma de la tributacion; del proteccionismo aduanero, etc. Se ejecuta 
la indagacion numerica en esa ocasion y luego no se vuelve a efectuar. Son investigaciones 
intencionales o aisladas. 

□ Es periodica aquella investigacion que se repite de tiempo en tiempo, en lapsos regulares. 
Los censos en periodos decenales; la estadistica industrial, con periodicidad anual; la del 
comercio exterior, mensual; los precios de los viveres, semanal; semestral, la estadistica de 
los dividendos de las sociedades anonimas; diaria, la informacion de los dividendos de las 
sociedades anonimas, la informacion de los precios del cafe, del ganado sacrificado en el 
matadero de Bogota, D.C. y de las cotizaciones de las divisas extranjeras; dos veces al dia, las 
estadisticas de cotizaciones y operaciones en la Bolsa. 

□ Es continua la investigacion automatica, es decir, la que se produce sin interrupcion. Las 
informaciones demograficas (la natalidad, la mortalidad, la nupcialidad); las de criminalidad, 
las del trafico por carreteras y rios, las de los transportes ferreos, de ciertos espectaculos 
(cines), de articulos de consumo. 

□ Es registro permanente, a medida que el hecho tiene lugar. 

Son normas generales, puesto que particulares no se pueden senalar, sino en la simple discusion 
concreta de cada estadistica, son: 

□ Periodicidad y duracion suficiente para observar el hecho o fenomeno. 

□ Fechas normales, cuando el hecho o fenomeno presente caracteristicas habituales, corrientes o 
cuando no sea ni muy intenso ni muy debil. 

Por ejemplo, una investigacion sobre los ingresos y gastos familiares en Europa tiene que durar 
todo el ano porque las cuatro estaciones climaticas afectan el presupuesto del hogar, cuatro caracteris¬ 
ticas consumidoras y cuatro gastos distintos; en el tropico se considera suficiente un mes de duracion, 
porque la variabilidad de las compras es pequena en los cuatro trimestres del ano. 

Los fenomenos que cambian mucho y en cortos lapsos, exigen una periodicidad de investigacion 
grande, las cotizaciones en la bolsa se registran manana y tarde. Las temperaturas y demas condiciones 
meteorologicas, tres y cuatro veces al dia, cuando no continuamente. Pero los precios de las mercancias 
al por mayor suelen investigarse semanalmente. La estadistica bancaria se publica de un mes a otro, 
como la de la produccion minera y del comercio exterior. Las modificaciones entre dos semanas o entre 
dos dias no son tan grandes como para anotarlas. 

Los datos sobre el estado de desarrollo de la educacion se conocen anualmente. En periodos semes- 
trales los balances de las sociedades anonimas. Decenales, los censos de poblacion. 

Las estadisticas discontinuas , pueden tener una mayor o menor periodicidad en funcion de su ma¬ 
yor o menor variabilidad de fenomenos que se alteran mucho, frecuentes periodos; en los que se alcanzan 
a notar cambios muy de tarde en tarde, periodos bastante separados. Pero ademas, el “momento estadis- 
tico” encierra la eleccion concreta de la fecha o fechas. Y decimos que esta debe ser un periodo normal. 
Investigar la ocupacion obrera, por ejemplo, cuando la actividad del trabajo se halle en su grado habitual 
y no cuando por un motivo extraordinario y pasajero haya un numero excesivo de desocupados o una 
actividad tambien excesiva. 



CAPfTULO UNO 

CONCEPTOSGENERALES 


19 


El costo de vida no podria investigarse unicamente durante el mes de diciembre o el de enero, 
porque el ultimo mes del ano por exceso de gastos y el primero del ano por defecto de gastos, serian 
notablemente anormales. 

Ni el censo de poblacion podria levantarse el 24 o 25 de diciembre, porque un nucleo no desprecia- 
ble de gentes, se halla en esas fechas en un lugar fuera de su habitual o legal de residencia o domicilio. 

Por ultimo, no hay que olvidar en el proyecto de investigacion el periodo preliminar de preparacion, 
que proceda a la recopilacion de los datos. Su iniciacion y duracion deben determinarse de antemano. 
Por tal motivo se recomienda la elaboracion de un calendario de trabajo que incluya a cada una de las 
diferentes etapas de investigacion con sus fechas respectivas de iniciacion y terminacion. 

Todos estos elementos intervienen en los puntos siguientes: el personal, el material, la propaganda 
y el costo. 

^Quien debe hacer la investigacion? La pregunta de quien debe hacer la investigacion comprende 
un doble aspecto: primero la entidad u organismo, segundo el personal. Ambas hay que fijarias en el 
proyecto. 

Entidad: pueden ser instituciones u organismos publicos oficiales o privados, particulars, de los 
gobiemos o de las personas o asociaciones particulars. 

Ambos tienen ventajas y ambos, unos frente a otros, tienen inconvenientes, veamos: 

Principales desventajas de las entidades publicas: 

□ Infunden recelo y suspicacias sobre la finalidad que los gobiernos persiguen con la estadistica: 
temor fiscal, temor policial, etc. 

□ Frecuentemente el costo de las investigaciones es mas elevado que en las entidades privadas. 

Principales ventajas de las entidades privadas: 

□ Son mas indicadas para las encuestas ocasionales de tipo cientifico, problemas sociales, 
medicos, higienicos, etc. 

□ Ofrecen al publico mas confianza que los gobiemos: los datos se conceden con mayor 
sinceridad. 

Los inconvenientes de las entidades privadas corresponden a las ventajas de las instituciones pu¬ 
blicas: menos recursos economicos, sobre todo en los paises de escaso desarrollo de las investigaciones 
cientificas; mas reducida organizacion administrativo-territorial y falta de poder coactivo. 

En las naciones de gran proceso estadistico, como Estados Unidos, Francia, Italia, Inglaterra y Ale- 
mania, son numerosas las entidades privadas que realizan investigaciones de esta clase. En America del 
Centro y del Sur, todavia es deficiente el desarrollo de la investigacion no oficial. 

Desde el punto de vista de la Administracion Publica no es discutible la conveniencia y la necesidad 
de que los gobiemos dispongan de un servicio de Estadistica Nacional y Seccional; las estadisticas ge¬ 
nerates o parciales de los paises solo pueden llevarse por los gobiernos, maxime teniendo en cuenta que 
para el publico las informaciones deben ser gratuitas y generalmente conocidas. 
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En la actualidad se vienen realizando encuestas a traves de los medios escritos (periodicos, revis¬ 
tas), radiales y de TV., algunos mediante entrevistas, otros en forma voluntaria con llamadas al medio 
de informacion o escritas, siendo de mayor uso del Internet, telefonicas o del celular, sin embargo los 
resultados son poco confiables, dado que no hay seleccion al azar del informante, procedimiento valido 
para una muestra aleatoria. 

P ersonal. Tambien en el proyecto tiene que tratarse el personal que ha de ser reclutado para la inves¬ 
tigacion. Se fijara el numero, las atribuciones y las categorias de los distintos puestos. Alrededor del tema 
del personal, plantea el problema delicadisimo de su eleccion, de su instruccion y de su remuneracion. 

Nos parece conveniente hacer estas advertencias al respecto: 

□ La instruccion, requiere cursos de preparacion, sobre todo en donde la cultura y formacion 
estadistica no sean grandes. 

□ La eleccion debe atender a la instruccion, puede ser mediante examen previo, de aptitud 
y vocacion y a la imparcialidad de los aspirantes al puesto de estadistica, es decir, que el 
empleado sea ajeno a los intereses particulars que puedan entrar en juego en las informaciones 
estadisticas. 

Aparte de eso, todo el personal que trabaje en estadistica debe ser constantemente controlado en 
sus tareas, sobre todo cuando estas se refieren a calculos, a clasificaciones, recuentos y construccion de 
tablas. El control tambien debe existir para el personal de recolectores, con el fin de comprobar si los 
datos que ellos recogen son ciertos o no. 

Desgraciadamente el personal que se vincula, lo hace en forma transitoria, solo quiere resolver su 
situacion laboral por un tiempo menor, mientras consiga mejores condiciones salariales y de estabili- 
dad. 


Sistemas de investigation: se distinguen varios procedimientos de investigacion: 

□ Las recopilaciones automaticas de datos por declaracion espontanea del sujeto de la 
investigacion. Se refiere generalmente a las investigaciones por medio de registros o 
inscripciones obligatorias; como en el caso de las estadisticas demograficas (natalidad, 
nupcialidad, mortalidad, migracion). Su caracter automatico estriba en el hecho de producirse 
en cumplimiento de una disposicion legal o de una costumbre, de una tradicion. La estadistica 
del movimiento de divisas extranjeras, por ejemplo, es automatica, porque se forma en virtud 
de la obligacion de solicitar la compra de monedas extranjeras y acudir a su cambio o venta a 
la Oficina de Control de Cambios del Banco del Estado. La estadistica del comercio exterior, 
la de las edificaciones, la estadistica de los recaudos gubernamentales por concepto de los 
impuestos, son otros ejemplos de estadistica automatica, que automaticamente y sin necesidad 
de buscarlo, se producen mediante la anotacion de los hechos en oficinas administrativas: 
Recaudacion de impuestos, Aduanas, Banco del Estado, Secretarias de Obras Publicas 
Departamentales, etc. 

Es un buen sistema para recoger informaciones de esta clase, puesto que la obligatoriedad 
legal o la fuerza de la costumbre influyen en la exactitud sinceridad y generalizacion de las 
informaciones. 
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□ Las recopilaciones intencionales de datos, obtenidas mediante el empleo de un agente que ex 
profeso vaya a la fuente de informacion para registrar los datos: el censo de la poblacion, las 
encuestas de hogares sobre ingresos y gastos, las encuestas sobre sistemas de trabajo, sobre 
condiciones de una determinada industria, etc. En ellas se utilizan los cuestionarios, boletines, 
formularios, cedulas o patrones de inscripcion de los datos. 

La organizacion y establecimiento de este sistema de compilar datos se efectua con una finalidad 
propiamente estadistica, a diferencia de las recopilaciones automaticas en las cuales el motivo de la 
declaracion no es propiamente estadistico. El registro civil, demografico, la inscripcion catastral, de la 
propiedad, de las sociedades comerciales, etc. La estadistica, en estos casos, lo que hace es adjudicar a 
los registros de otra naturaleza la obtencion de estadisticas, aprovechando los servicios del Estado. 

Las investigaciones sistematicas, por ser exclusivamente estadisticas, ofrecen las ventajas de poder 
organizarse conforme a una tecnica completa y abarcar todos los aspectos que requieren las necesidades 
del servicio de estadistica. 

□ Las recopilaciones combinadas automaticas e intencionales. En ellas se anaden a las 
informaciones del servicio ajeno al de la estadistica, las preguntas que exige una buena 
investigacion estadistica. En el registro eclesiastico se anotan automaticamente los matrimonios 
y los nacimientos, se aprovecha esta circunstancia para poder indagar algunas cuestiones que 
al registro de la Iglesia no le interesarian. 

□ Algunos estadisticos, clasifican las investigaciones, en extensivas e intensivas y estas en 
monograficas y encuestas. La diferencia se basa en el numero de datos que abarcan y en los 
detalles a que llegan. 

Cuando la recopilacion se limita a las preguntas esenciales, a los datos muy generates, tal como 
ocurre en los censos, en la estadistica bancaria, en la del comercio exterior y en la fiscal; y su extension 
es completa por proceder de todo el campo de la investigacion: se denomina extensiva. La mayoria de las 
recolecciones de datos periodicos y continuos son de esta naturaleza. 

Cuando, por el contrario, la investigacion se detiene en aspectos muy particulares del hecho, se ha- 
cen muchas preguntas y muy minuciosas y cuando se reduce a un sector del campo de la investigacion, 
se le llama intensiva. La mayoria de las investigaciones ocasionales son intensivas. 

Ejemplos reales de las primeras son los censos, la estadistica de precios y salarios, las monetarias, 
entre muchas otras. Ejemplos de la segunda, intensivas, son las encuestas campesinas, de costo de vida, 
de alimentacion, etc. 

□ Investigaciones completas , incompletas y mas que completas, continuamos la division 
didactica del profesor Conrado Gini, division necesaria a efectos de la ensenanza del metodo 
estadistico, y mas que nada para poder efectuar una critica y correccion tecnica. 

Son completas , las investigaciones que recogen todos los casos. Indagan todo el campo de la ob- 
servacion; cuantas unidades de las operaciones bancarias, (es otro ejemplo de informacion completa), 
entran en todos los balances de la banca. La produccion de sal, la de cemento, los transportes aereos, la 
estadistica fiscal, son otros tantos ejemplos de estadisticas completas; se tomarian todas las fabricas de 
cemento, todos los aeropuertos y todas las oficinas que tenga el Ministerio de Hacienda. 
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Son incomptetas , las investigaciones que solo atienden a una parte de las unidades estadisticas, bien 
por no ser posible recoger la totalidad de los datos, o bien por no ser necesario para el fin que se persi- 
gue. Si la estadistica incompleta no es representativa del conjunto, no es tipica como para generalizar los 
resultados parciales al conjunto de los casos; su valor es nulo, o bien pequeno. En caso contrario, cuando 
el circulo estudiado numericamente puede sustituir al total, la estadistica incompleta es de extraordinaria 
utilidad. 

Son mas que completas , las investigaciones que repiten varias veces una misma anotacion, a veces 
intencionalmente como control, otras inadvertidamente, dando origen a un error. 

Pero no faltan ocasiones en las cuales el estadistico voluntariamente hace una misma pregunta en 
un formulario de dos formas distintas para verificar la una con la otra: salario medio de una empresa 
por un lado, y numero de jomadas y valor total de los salarios, por otro; el primer dato se deduce de los 
segundos. Edad y fecha de nacimiento, etc. 

□ Investigaciones representatives y no representatives. En la critica de este problema hemos de 
ocuparnos de la responsabilidad de un grupo, de una muestra estadistica. Bastenos advertir 
ahora que la condicion esencial para que un grupo limitado represente el total de casos, es 
que el grupo parcial contenga elementos de la misma caracteristica del total y con iguales 
frecuencias. 

La encuesta de costo de vida obrera hecha solo entre los obreros de una fabrica de cervezas, no 
serviria como muestra de toda la clase obrera de una ciudad, porque los salarios de aquella empresa no 
reunen las mismas caracteristicas, en sus ingresos, gastos, prestaciones sociales, clase de trabajos, ofi- 
cios, residencia, que se observan en toda la masa de trabajadores de la ciudad. Incluso, tal vez, la compo- 
sicion demografica de las familias de aquel sector de obreros sea distinta de la composicion familiar de 
todo el obrerismo del pais. Nos hallariamos ante una estadistica poco representativa. 

□ Investigaciones obligatorias voluntarias. Son obligatorias en cuanto a la rendicion de datos; 
por lo general, las que organizan los gobiemos, porque valiendose de la atribucion legal para 
exigir las aclaraciones, asi se dispone. El registro civil, base de la estadistica demografica; la 
declaracion de las importaciones y exportaciones, son obligatorias, como la mayoria de las 
estadisticas que llevan las entidades que el Estado ha creado para ello. 

Sin perjuicio de esto, los organismos del Estado tambien pueden y suelen organizar investigaciones 
voluntarias, ante las cuales el publico puede contestar o dejar de hacerlo. 

Las recopilaciones voluntarias de datos, frecuentemente se llevan a cabo por las instituciones pri- 
vadas y se refieren comunmente a las monografias y encuestas cientificas. La radio, prensa y las re vistas 
suelen invitar a sus lectores a opinar sobre algunos problemas candentes o a declarar un dato de su vida 
o negocio particular. 

Pues bien, de estos sistemas, el proyecto, para el caso particular, tendra que decir cual interesa mas 
y cual debe emplearse. 

Algunos autores consideran tres sistemas importantes de recoleccion: correo, entrega personal del 
cuestionario y la entrevista; otros sistemas de menor importancia corresponden a: internet, telefono , fax 
y panel. 
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Todos ellos presentan ventajas y desventajas. Se considera que la entrevista presenta mas ventajas 
que los otros sistemas, siendo la mas importante: mayor numero de cuestionarios recolectados, mayor 
numero de respuestas, permite aclarar el objetivo de la investigation y las dudas del informante. Entre las 
desventajas se menciona: mayor costo, mas tiempo para la recoleccion y una cantidad mayor de personas, 
ademas, la influencia negativa que puede presentar el entrevistador. 

L a organizacidn. Es este otro de los problemas que debe estudiarse en un proyecto; que forma se va 
a dar a la organizacion de la estadistica de que se trate. Existen dos tendencias: centra I ista y descentra- 
lista. 


L a centralizacion. Es incuestionablemente necesaria en el orden tecnico. La tecnica, las normas ge¬ 
nerates, la direccion de toda investigacion debe ser central y general para todo el territorio, para el campo 
de cada investigacion y para todos los organismos inferiores y el personal que intervenga. 

Es el unico derecho y medio de conseguir unidad en los sistemas y de poder totalizar los datos de 
todo un municipio, de todo un departamento, o del conjunto del pais. Si se deja a cada seccion que realice 
las estadisticas que quiera y por los medios que se le ocurran, las diferencias regionales impediran reunir 
en totales nacionales los datos e incluso haran imposible las comparaciones interregionales. 

L a descentralizacion. Debe emplearse en el orden administrativo, en el orden ejecutivo, para selec- 
cionar personal, para cooperar en el presupuesto de la estadistica, para aportar el material, para recoger 
los datos, para controlar la bondad de las investigaciones, para, en fin, servir de intermediaria entre las 
diversas categorias de dependencias. 

Claro esta que a la centralizacion, en ningun caso, puede corresponder uniformidad absoluta en lo 
esencial y en lo accidental. La direccion central debe tener en cuenta las particularidades regionales del 
hecho o fenomeno que se investiga estadisticamente, con el fin de ajustar el proyecto a las distintas ca- 
racteristicas geograficas. 

El material estadistico 

Esta constituido por todos los utiles, documentos o instrumentos necesarios para llevar a buen fin la 
investigacion. El proyecto tiene que enumerarlo en sus clases y en su numero. Podemos dividirlo en: 
material impreso e instrumental. 

Material general para la investigacion y material para la investigacion de que se trate. 

M aterial impreso. Se refiere a los formularios o cuestionarios, boletines, hojas de inscripcion, regis- 
tros, circulares, pliegos de instrucciones. 

El formulario, boletin, boleta o cuestionario, que de todas las formas suele denominarsele, es el 
instrumento que sirve para anotar las respuestas o el producto de la observacion personal del hecho que se 
investiga. 

Los formularios pueden ser: 

□ C olect'lVOS. Destinados a la inscripcion de los datos de varias unidades estadisticas, principal- 

mente cuando esas unidades son personales. El formulario del censo de poblacion es colectivo, 
puesto que en uno se reune la informacion de todos los habitantes de una vivienda u hogar. 
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Tiene la ventaja de facilitar la recepcion de los mismos en la oficina que investiga, puesto que 
los colectivos son menos en cuanto al numero y supone por esto mismo, una economia en la 
impresion. Exigen, generalmente, un investigador que haga las anotaciones y que lleve perso- 
nalmente el formulario. 

□ / ndividudles. Destinados a la inscripcion de los datos de un solo elemento o unidad estadistica: 
una persona, una fabrica, un almacen, una sociedad industrial, una nueva construccion, un 
hospital, una escuela, etc. 

Ofrecen la gran ventaja de facilitar el agrupamiento, el recuento o escrutinio, con solo amontonar 
los formularios de una misma naturaleza: por departamentos, por clases, por industrias, por paises de 
origen, por paises de destino, por sexo, por importancia de un caracter cuantitativo como capital, pro- 
duccion, consumo, importe del salario, etc. 

Contenido de un formulario. En general todo formulario debe contener: 

□ El encdbezdmiento que comprende: el nombre de la institucion u organismo que realiza 
la investigacion: Universidad Nacional, Investigaciones Economico-Sociales, Federacion 
Nacional de Cafeteros, Departamento de Investigacion de Mercadeo, etc. Un numero que lo 
personifique de los demas. Esta enumeracion puede ser doble: 1. Numeracion de orden igual 
para todos los ejemplares de un mismo formulario. 2. Numeracion de orden, dentro de un 
mismo formulario, para cada unidad estadistica. 

El titulo del formulario, que nos diga de que investigacion se trata: “Investigacion sobre la pro- 
piedad”. “Investigacion sobre precios”. Ademas como, cuando y donde se realizo la investigacion. 

□ El cuerpo abarca la indicacion de la clase, direccion y nombre de la unidad o grupo estadistico 
que se investiga. Ademas las preguntas generates relativas a toda la unidad. No siempre es 
necesario dedicar la primera parte del cuerpo a generalidades, que tiene por objeto recoger 
informacion sobre el nombre del informante, direccion, sexo, ocupacion, cuando se trata 
de personas; o nombre de la entidad, razon social, direccion, actividad economica, etc. De 
acuerdo al objetivo, se puede prescindir de este tipo de preguntas. 

Tambien comprende las preguntas particulares relativas a la unidad o unidades examinadas. El 
cuerpo de un formulario puede disponerse en serie o en cuadro. En forma de serie o cuestionario, una 
pregunta despues de la otra, se emplea frecuentemente cuando el formulario es individual; en forma de 
cuadro, cuando es colectivo. No es extrana tampoco la combinacion de ambos sistemas en un mismo 
formulario. Incluye preguntas de control, filtro, abiertas , cerradas que pueden ser de seleccion multi¬ 
ple o dicotomicas. 

Las preguntas pueden ser cerradas , cuando se responde si o no; abiertas , en el caso de que se 
pida una opinion; seleccion multiple , si se da una serie de alternativas para que escoja una o varias; 
control , para determinar la veracidad del informante; y preguntas filtro , que nos determinan si se debe 
dar por terminada la entrevista o si debe pasar a otra parte del formulario. 

Las preguntas deben ser: claras y sencillas; utilizando el mismo vocablo del informante; se inicia 
con las mas faciles y se termina con las mas complejas; no se deben hacer preguntas que no vayan a 
tener respuesta. 
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Las observaciones: en todo formulario conviene destinar un espacio libre al final, en la ultima co- 
lumna del cuadro, para que el investigador o el investigado puedan anotar las aclaraciones y observaciones 
que crean convenientes, como complemento de las preguntas impresas, de por si rigidas. 

□ Las instrucciones: casi siempre, la brevedad y concision de las preguntas de un formulario 
exigen explicaciones de su sentido o sobre la manera de dar respuesta. Para facilitar la 
labor del encargado de llenar el documento, se incluyen algunas instrucciones, bien en 
el mismo formulario (al pie, en la cabeza o al dorso), con sus correspondientes llamadas 
entre parentesis (1), (2), etc., bien en pliego aparte cuando son extensas. En este ultimo 
caso, ninguna pregunta puede ser omitida, aun cuando no haya necesidad, por la claridad 
y precision de la redaccion, debera acompanarse una enumeracion metodica en forma de 
codigo y con ejemplos: 10, 20, 30, etc. 

No hay criterio unificado, sobre el lugar del formulario donde deben colocarse las instrucciones. Al- 
gunos consideran que debe ser despues del encabezamiento, para obligar al informante a leerlas antes de 
iniciar la contestacion, pero otros, aconsejan ubicarlas ya sea al final o en cartilla separada del formulario 
aduciendo una mejor presentacion. 

□ La fecha de envio del formulario a la entidad que recoge los datos. 

□ La firma responsable del investigador o agente cuando lo hay, o del investigado cuando este 
informe directamente: propietario, administrador, gerente de una empresa. 

Tambien suele incluirse al pie, un renglon para la firma o visto bueno del jefe o coordinador de la 
investigacion, el nombre o firma del entrevistador. 

Trazado y redaccion de los formularios. Al proyectar una nueva investigacion, se debe disenar 
el material que vaya a repartirse y someterlo a discusion y aprobacion como el resto del proyecto. 

Las normas del diseno y redaccion son las siguientes: 


• Debe ser SUCintO, es decir, limitado a las preguntas esenciales, justamente las que 
se necesitan para los fines de la investigacion y que en realidad puedan obtenerse 
de la fuente informativa. 

• Debe prescindirse de toda pregunta indiscreta que levante suspicacias y temores o 
que moleste al investigado. 

• Debe ser claro , facilmente comprensible por cuantos, de una u otra manera, 
tengan que manejarlo. No ofrecer dudas sobre la forma de contestar cada pregunta; 
que no admita sino una sola interpretacion. 

• Categoria , generalmente las respuestas deben limitarse a un numero o a una 
afirmacion (si) o una negacion (no), por lo tanto las preguntas deben ser cerradas. 

• Debe procurarse evitar los juicios personates del investigador o del investigado, 
como cuando se deja a criterio del calificador juzgar la importancia o la bond ad de 
un hecho (grande, mediano, o pequeno); (bueno, regular, malo). 


0 tros aspectOS: la cuestion de los formularios trae consigo otros considerandos que deben resolverse 
en el proyecto. Estos son: clase de papel, forma de impresion (mimeografiados, en imprenta), tamano 
general y espacios intensos; anulacion de casillas en los cuadros por no tener que contestar, inclusion de 
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preguntas de control, diversidad de colores en las tintas, rayados fuertes y debiles, etc. Todos los problemas 
relativos a las labores de imprenta. 

Pero lo esencial es, en la etapa de prospeccion, calcular el numero de formularios que se han de ne- 
cesitar para la investigacion previa y para la definitiva. 

Todo formulario antes de imprimirlo, debe ser ensayado con una recoleccion real de datos. Por 
muy perfecto que se suponga el modelo en una oficina, la practica ensena a perfeccionarlo, a corregir la 
redaccion, a suprimir lo imposible e innecesario, a anadir lo que se dejo en olvido. Por otra parte permite 
establecer el tiempo necesario para su diligenciamiento, la reaccion del informante y la claridad de las ins- 
trucciones. Lo anterior implica la realizacion de una encuesta preliminar 0 piloto. El material impreso lo 
podemos dividir en dos: material de recoleccion y material de elaboracion. 

E quipos. En la recoleccion de datos, a veces, y en la elaboracion posterior casi siempre se requiere de 
muchos instrumentos, aparatos, maquinasy utiles, que quien proyecta debe tener en cuenta, en su numero 
y clase. 

En cualquier investigacion, generalmente se necesitan maquinas calculadoras, sumadoras, de escri- 
bir, tablas de calculo, computadores con programas estadisticos (Microstat, SPSS, SAS, Estagraf, TSP, 
etc.) material de dibujo y los utiles propios de toda oficina. 

En las grandes investigaciones (censos, comercio exterior, estadistica fiscal, de criminalidad, etc.), se 
necesitan equipos que permitan el procesamiento de grandes cantidades de information. 

En ciertas investigaciones especiales, se requiere tambien de un instrumento especial, sin el cual 
no se podrian recoger los datos. Si es una investigacion antropometrica, requiere escalas cromaticas de 
la piel, del pelo y de los ojos, cinta metrica, balanza, etc. Si es de una investigacion meteorologica, ter- 
mometros, barometros, pluviometros, etc. Si se trata de llevar en una empresa un registro estadistico del 
horario de entradas y salidas del personal, se recurrira a un reloj de marcar. Lo mismo en un aparcadero 
sobre entrada y salida. En un almacen, la estadistica de ventas e ingresos se lleva en la caja registradora 
y por ultimo, los datos del movimiento de viajeros en los buses se conocen por el control mecanico de los 
usuarios. 

El presupuesto de la investigacion 

El presupuesto comprende el calculo del costo y su financiacion; las partidas del costo, en general, suelen 
ser las siguientes: 


a. Organization 


Estudios preliminares 
Trabajos geograficos 
Plan de propaganda 


Asesorias 


Formulation del plan 
Impresion del formulario 


Adiestramiento del personal Contratacion de servicios auxiliares 
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Materiales y equipos. 

b. Trabajos de campo (recoleccion) 
c . Sistematizacion 
d. Publicacion. 


Ambos aspectos, la forma de allegar los recursos y la estimacion previa de los gastos, constituyen el 
ultimo punto de un proyecto de Investigacion Estadistica. 

La preparation. Una vez redactado el plan de la Investigacion Estadistica y antes de llevarlo a la 
practica, requiere ser sometido a un ensayo denominado preparacion. 

Todo proyecto de esta clase, conviene ser discutido y aprobado, en ultimo termino, por un grupo de 
entendidos y tecnicos en estadistica, puesto que, por regia general, los proyectos enteramente individuates 
no suelen ser perfectos, adolecen de algun defecto que el encargado de realizarlo no alcanzo a ver, la 
critica de un plan estadistico no solo debe estar hecha por los peritos en procedimientos estadisticos, sino 
tambien por los tecnicos en las materias que van a investigarse. 

En materia de estadistica agricola, se necesita el parecer de los agronomos y de los agricultores. En 
una investigacion industrial el de los administradores y empresarios. En una informacion comercial el del 
gremio de comerciantes y para una estadistica bancaria, o sindical, no puede prescindirse de la opinion de 
los banqueros o de los sindicatos, respectivamente. 

Aprobado el plan con las modificaciones del consejo de tecnicos, se inicia la preparacion del mis- 
mo. Esta comprende la practica y el ensayo o prueba en los siguientes aspectos: 

□ Adiestramiento y election del personal por medio de cursos mas o menos breves y 
entre vistas. 

□ Ensayo de investigation sobre el terreno. Esto supone el ensayo correspondiente a la epoca y 
fecha del material, del propio personal, utilizado de la fuente de informacion que genera, de la 
organizacion y de los programas a los sistemas que se utilizan. 

□ E lection y preparacion dela fuente informativa. No basta con adiestrar personal de recoleccion 
e investigadores. Se requiere, al mismo tiempo, instruir a los sujetos o a las entidades que van 
a ser investigados, sobre los registros contables o previamente estadisticos que deben llevar, 
sobre la manera de contestar los cuestionarios, sobre la fecha de visita de los recolectores, 
sobre la obligacion de rendir los datos, etc. 

□ Preparation del material de la encuesta. La impresion, conexion, el reparto de material, su 
adquisicion cuando se trata de instrumentos, son gestiones que como deben estar terminadas 
antes de dar comienzo a la recoleccion propiamente dicha de los datos, entran dentro del 
periodo preparatorio. 

□ P ropaganda. La labor de anunciar que se va a proceder a una investigacion estadistica, 
las disposiciones del animo del publico afectado por la investigacion, el aislarla de todo 
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intervencionismo perjudicial del Estado, de todo recelo contra la solicitud de datos o de todo 
temor por las consecuencias que puedan presumirse; el dar a conocer el interes general de los 
datos estadisticos, incluso y principalmente para aquel que los rinde, llena esta funcion de 
propaganda de las estadisticas, cuya realizacion encaja necesariamente en la fase preparatoria. 

□ La preparacion y actualizacion del listado de informantes o marco de referenda que son objeto 
de investigacion; esta labor debe desarrollarse en su totalidad. 

□ En algunas investigaciones se requiere del uso de la cartografia , por lo tanto es necesario 
haberla preparado o actualizado. 

□ F inanciacidn. La consecucion del dinero necesario para cubrir todos los gastos, incluso 
la elaboracion posterior, no debe dejarse para mas tarde de esta etapa de preparacion. 
Desgraciadamente, son frecuentes las investigaciones que no se terminan, aun despues de 
haberse hecho el esfuerzo y el gasto parcial, necesarios en la recopilacion de los datos. 

□ Hay aspectos, ademas de los anteriores que merecen especial atencion por ejemplo: 
el calendario de trabajo que consiste en una descripcion de las diferentes etapas de la 
investigacion, indicando la fecha de inicio y de termino de cada etapa; en algunos casos se 
utilizan las barras Gantt que se colorean a medida que se realiza el trabajo. La formulacidn de 
hipdtesis en aquellas investigaciones por muestreo en las que se desea hacer comprobaciones; 
el examen de la documentacion requerida antes de comenzar la investigacion, siendo posible 
que la investigacion haya sido realizada y no se requiera de un nuevo estudio; en otros casos 
el proceso sera unicamente de actualizacion, y en situaciones extremas se podrian utilizar 
las experiencias, corrigiendo los errores cometidos; finalmente la unidad de investigacion , es 
decir, a quien va dirigido: una persona, familia, hogar, manzana, barrio, empresa, etc. 

La duracion del periodo preparatorio depende de la clase de investigacion. Hay estadisticas que re- 
quieren un corto plazo para realizarlas (precios, salarios, produccion, transportes) y otras exigen meses 
(censos de poblacion, industriales, ganaderos y agricolas, encuestas de hogares). 

RECOLECCION 

Preparada la investigacion, comienza la recoleccion definitiva de los datos. 

De esta tarea depende todo el resultado posterior de la estadistica. Si esta mal hecha, la elaboracion 
resultara incorrecta e incluso imposible de efectuar, y si se realiza, dara origen a un analisis erroneo y a 
interpretaciones falsas. 

La investigacion externa de los hechos, recopilacion del material basico, puede efectuarse por muy 
diversos sistemas y con muy distintos fines. 

Puede referirse a los datos preliminares o a los datos definitivos. La investigacion preliminar coin¬ 
cide con las labores de preparacion que hemos visto antes. Su necesidad se deja sentir mas cuanto mas 
extensa y complicada sea la investigacion. Presta un triple servicio: ensena, controla los resultados y sirve 
para la organizacion. 

Su valor como medio de control, porque los datos previstos, su distribucion y sus peculiaridades 
indican la calidad del material (formularios), el personal indispensable, la propaganda conveniente, la 
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eleccion de las fuentes informativas, la manera de repartir y recoger el material, la fecha apropiada, la 
duracion, y los procedimientos a regir en la sistematizacion de los datos. 

La etapa de recoleccion comprende varios aspectos: 

□ Distribucion del material o instrumento de recoleccion 

□ La recoleccion propiamente dicha 

□ Control del numero de formularios recolectados 

□ Control sobre la calidad de las informaciones recogidas 


CRITICA Y CODIFICACION 

De la investigacion se obtienen los datos individuales, colectivos o aislados. Cada cifra presenta la 
intensidad de un hecho particular; el salario de un obrero, la produccion de una fabrica o los prestamos 
otorgados por una entidad de credito. 

Es un conjunto de operaciones de revision y correccion de la informacion 
recolectada, que nos permita agruparla y procesarla, de tal manera que nos facilite 
la elaboration de cuadros, graficas y analisis, necesarios en la publication. 

Todo ese conjunto de material recogido en los formularios antes de ser totalizado y utilizado, re- 
quiere un examen critico, severo, con el objeto de comprobar si cumple con estas condiciones indispen- 
sables; ^son exactos o erroneos los datos?, ^son completos, precisos o imprecisos, representativos o no 
representativos? 

El objeto de la critica, es clasificar el material primario que precede de la misma 
investigacion, en tres grupos: material bueno, material incorrecto pero corregible y 
material incorregible o desechable. 


La clase y la importancia del error cometido, determinan la admision o no del dato primitivo resul- 
tante de la observacion o declaracion. Ademas, se critican los datos numericos directos para establecer las 
causas de los errores y modificar o perfeccionar las fuentes y los metodos de observacion. 

Dificilmente se consigue, por primera vez, informaciones perfectas, en cuanto a la exactitud, a la ex¬ 
tension y consecuencialmente en cuanto a la responsabilidad de las investigaciones parciales. 

La necesidad de procesar las informaciones, recogidas en los cuestionarios, ha obligado a traducir las 
respuestas en codigos. Por ejemplo el codigo para la pregunta estado civil: 


Soltero 

i 


Divorciado 

4 

Casado 

2 


Separado 

5 

Viudo 

3 


Otro 

6 


Cuando el numero de respuestas pasa de 9, es preciso utilizar cifras de dos digitos. 
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EJEMPLO A EJEMPLO B 


CLASIFICACION 

POR PROFESION 


CLASIFICACION POR CATEGORfAS 
SOCIO-PROFESIONALES 

Abogados 01 


0 Agricultores 

Arquitectos 02 


00 Agricultores (sin ninguna indicacion) 



01 Propietarios explotadores 



02 Colonos 

Zootecnistas 20 


03 Aparceros 


TABULACIONES O PROCESAMIENTO 

Puede ser manual, mecanica o computarizada y su eleccion dependera: 

□ De la cantidad de formularios que se van a utilizar. 

□ Del numero de preguntas que tenga el formulario. 

□ Del tiempo y de los recursos, ya sean financieros o de equipo disponible. 

Cuando la tabulacion se acuerda desde el principio, como parte integrante de la planeacion general de 
la investigacion, es de suponer que todo el proceso sera totalmente satisfactorio, lo cual ha sido demos- 
trado por la experiencia. 

Del proceso que origina una base de datos, de la cual se obtienen listados , son revisados a fin de de- 
tectar las inconsistencias que se presenten en los procesos anteriores. Una vez hechas las correcciones, se 
procede a elaborar los cuadros , con el fin de facilitar el cruce y analisis de la informacion, la elaboracion 
de graficas , las conclusiones y las recomendaciones, si las hay 

Hoy en dia, el procesamiento de datos, la obtencion de resultados, la aplicacion de ciertas medidas 
estadisticas, se realizan con mayor rapidez y confianza si se utilizan paquetes estadisticos elaborados 
para tal fin. Entre otros, como ya se dijo: el SAS, el SPSS, el Microstat, Minitab, el Stagraf, TSP, etc. Por 
otra parte, el uso de la calculadora ayuda a agilizar los calculos en la aplicacion de las diferentes medidas, 
cuando se estan desarrollando ejercicios en una clase de estadistica o no se dispone del computador. 

ANALISIS E INTERPRETACION 

Esta etapa, se puede considerar como la mas importante del informe, ya que el analisis de los datos tendra 
que ver con la formulacion del objetivo mismo de la investigacion y de las hipotesis establecidas; sin 
embargo, este proceso de analisis tendra menos dificultad, si el investigador tiene pleno conocimiento de 
los problemas que son inherentes al planeamiento de una investigacion. 

En este proceso, se debe considerar la elaboracion de distribuciones o tablas de frecuencias obtenidas 
a traves de una sistematizacion de la informacion para poder ser presentada en forma de cuadros y grafi- 
cos. Con los anteriores resultados, se procede luego a hacer un resumen y a aplicar las diferentes medidas 
que hemos denominado estadigrafos 0 estimadores, puntuales , cuando son aplicados a las caracteristicas 
de las unidades en la muestra o como parametros aplicados en las caracteristicas de la poblacion, entre 
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los cuales figuran las medidas de dispersion y los promedios , incluyendo en estos los porcentajes y pro- 
porciones. 

Con las cifras resultantes, se pueden hacer comparaciones con otros estudios, para poder llegar a 
mejores conclusiones. 

De esta ultima fase de la metodologia se puede decir que encierra dos aspectos: 

a) Analisis y evaluacion estadistica de los resultados. 

b) Analisis y evaluacion tecnica de acuerdo con la naturaleza de la investigacion. 

Estos dos aspectos permitiran determinar el grado de consistencia y confiabilidad de los resultados ob- 
tenidos de la investigacion. 

El profesor Jhon W Best en su libro Cd/DO investigar en ediicacion nos da una posible guia del 
analisis, sugiriendo los siguientes puntos: 

1. Titulo 

a) ^Es claro y conciso? 

b) ^No promete mas de lo que el estudio puede proporcionar? 

2. Elproblema 

a) ^Se halla establecido con claridad? 

b) ^Esta bien delimitado? 

c) i Se reconoce su significado? 

d) /,Las preguntas son especificas o se han establecido las hipotesis con 
claridad? 

e) ^Se establecen supuestos y limitaciones? 

f) ^Se definen los terminos importantes? 

3. Revision de la bibliografia relacionada: 

a) ^Es de amplitud adecuada? 

b) ^,Se destacan los hallazgos importantes? 

c) i Esta bien organizada? 

d) ^,Se procura un resumen efectivo? 

4. Procedimientosutilizados: 

a) ^Se describe detalladamente el diseno experimental? 

b) ^,Es adecuado este diseno? 

c) ^Se describen las muestras? 
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d) ^Se reconocen las variables relevantes? 

e) ^Se procuran controles adecuados? 

f) ^Son idoneos los instmmentos de recoleccion de datos? 

g) i Se establecen la validez y la fiabilidad? 

h) ^Es adecuado el tratamiento estadistico? 

5. Analisis de los datos: 

a) ^Es adecuado el uso de tablas y figuras? 

b) ^Es concisa y clara la exposicion del texto? 

c) ^Es logico y perceptible el analisis de las relaciones de datos? 

d) i Se interpreta con precision el analisis estadistico? 

6. Resumen y conclusiones: 

a) i Se replantea el problema? 

b) /,Se describen en detalle los procedimientos? 

c) ^Se presentan concisamente los hallazgos? 

d) i Es objetivo el analisis? 

e) <^Los datos presentados y analizados justifican los hallazgos y conclusiones? 


PUBLICACION 

Corresponde a la fase final de la investigacion, y con ella se propone hacer llegar a las personas interesadas, 
el resultado total del estudio, teniendo en cuenta todos los aspectos considerados en el proceso, de tal 
forma que los datos sean comprensibles, con la correspondiente validez que merezcan las conclusiones. 


En terminos generates se puede decir que un informe debera contener: 

• Planteamiento del problema 

• Objetivo de la investigacion. 

• Hipotesis que se quieren probar. 

• Breve exposicion de la metodologia adoptada, diseno y tamano de la muestra. 
Proceso de seleccion de las unidades de informacion y de recoleccion. 

• Se podra incluir en el informe, copia del formulario utilizado en la recoleccion, aun 
relacionando y justificando, en forma muy sucinta, las preguntas que se consideran 
mas importantes dentro de la investigacion. 
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• Descripcion de los resultados en forma de cuadros y graficas, acompanados del 
analisis y comparaciones obtenidas a traves de los datos. 

• Conclusiones y recomendaciones. Estas ultimas cuando asi lo exija la investigacion. 

• En algunos casos, el informe tiene una parte final, denominada apendice, en donde 
se incluyen cuadros mas generales, que permiten aclarar o comprobar rapidamente 
cualquier informacion mas detallada. Tambien se puede incluir documentacion 
complementaria al informe. 


MONOGRAFIAS Y ENCUESTAS 


Al dividir las investigaciones en extensivas e intensivas, indicamos que estas ultimas se refieren, ante 
todo a estos dos metodos de recoleccion de datos tan en boga hoy y que denominamos M onografias y 
Encuestas. 

Las monografias se iniciaron en los sistemas de observacion social y economica por el Ingeniero y 
Sociologo frances Federico Le Play (1806-1882) a mediados del sigloXlX. Se aplico la monografia por el 
propio Le Play, por sus continuadores en las investigaciones de la situacion fisica, economica, sanitaria, 
moral, social, etc., de las familias obreras. Luego se extendieron estos mismos estudios a otras clases 
sociales y mas tarde a monografias de los municipios, regiones y talleres industriales. 

Como podemos deducir etimologicamente de la palabra monografia, se trata de la descripcion de un 
caso, para nosotros, de una unidad estadistica. Desde este punto de vista, estrictamente, la monografia no 
es investigacion estadistica, puesto que esta ultima, por su misma naturaleza, tiene que referirse a un grupo 
grande, el mayor numero posible de casos, salvo que se apliquen metodos de muestreo aleatorio, con lo 
cual se logra validez de los resultados obtenidos. 

Al analizar un solo caso, la monografia se detiene en multitud de aspectos y cuestiones que directa 
e indirectamente se relacionan o afectan al sujeto u objeto investigado. Intensifica el examen, recoge 
muchos detalles, se hacen muchas preguntas, que solo en un estudio profundo interesan. El fundamento 
cientifico de este metodo arranca de la razon de “muestra”, “sampling” en ingles, de la posibilidad de 
representar un conjunto o masa por un solo caso; es la tipicidad individual. Sus defensores nos dicen que 
asi como el quimico toma una cantidad (un litro) de agua para analizar la composicion quimica de un 
embalse y el ingeniero de minas se conforma con granos de mineral para calificar la riqueza de un filon, 
el sociologo, el economista y el hombre de negocios pueden, igualmente, limitarse a una muestra social o 
economica, a un ejemplo de lo sucedido en la vida del comercio y de las finanzas para luego generalizar 
al conjunto de lo observado en su caso. 

El estudio de un sujeto elegido como tipo. Un individuo, una familia, una empresa, una fabrica, un 
almacen, una hacienda, etc. En realidad el procedimiento monografico se diferencia, ademas, de la esta¬ 
distica porque indaga aspectos cualitativos que no se pueden reducir a cifiras, sin prescindir de preguntas 
cuantitativas de numeros e intensidades, pero tambien incluye inscripciones cualitativas y descripciones 
literarias, subjetivas, impresiones de observador o del observado. 

Es un sistema de observacion directa y de generalizacion indirecta: de un caso a todos. 
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Dificultades . Aun cuando se discute el hecho de que un caso, una familia, un edificio, un taller, 
etc., pueda representar bien todas las familias, oficios, talleres, etc., es evidente que existe un caso mas 
representative que todos los demas; la muestra mejor, el que al sustituir al conjunto comete menor error, 
compensa exactamente o tiende a comprender los errores, por ser unos por defecto y otros por exceso. El 
analisis monografico de ese caso precisamente y no de otro, no deja de tener interes. 

Pero la dificultad estriba en determinar de antemano en su conjunto, cual es ese caso mas represen¬ 
tative de la unidad a investigar. El tropiezo del metodo monografico, es la election a priori de la unidad a 
investigar: ^Como podemos saber que la familia, el taller, el municipio, o la empresa elegida al azar o con 
orientaciones parciales, representa bien a la colectividad de familias, talleres, municipios o empresas? 

Esta critica, con razon ha hecho que el sistema monografico puro, apenas o incorrectamente se 
emplee en la actualidad. 

A pesar de lo expuesto anteriormente, es un gran auxiliar de la estadistica propiamente dicha. La 
investigacion estadistica afecta a un gran numero de casos, en sus manifestaciones cuantitativas o cua- 
litativas traducibles a numero, y siempre indagando los aspectos esenciales del problema, fenomeno o 
hecho del mundo economico en nuestro caso. La monografia, si es representativa, confirma las conclu- 
siones de la estadistica y las reviste de detalles minuciosos, cualitativos, de descripciones sagaces y de 
interpretaciones, que ella -la Estadistica- por su naturaleza mecanica y estrictamente objetiva, no estaba 
en condiciones de captar. 


DIFERENCIAS DE LA ESTADISTICA CON LA MONOGRAFIA 

□ La estadistica observa y registra fenomenos colectivos, en su conjunto o en su mayor parte 
posible. 

□ La monografia, estudia intencionalmente solo un hecho. La estadistica, es exclusivamente 
numerica. La monografia es descriptiva o literal sin perjuicio de poder emplear el numero. 

□ El analisis matematico y grafico que emplea la estadistica, no caben en la monografia. 

La Encuesta. Para subsanar el defecto de la monografia, se comenzo a aplicar un procedimiento 
llamado por algunos autores franceses “Polomonografico”. Si un caso es insuficiente, estudiemos varios, 
si una monografia no basta, recojamos varias; de estas saquemos la mas representativa, a quien le atribui- 
remos, a su vez, la representation de todo el grupo. De esta forma, ademas de obtener una sola muestra 
bien elegida, de un grupo, el grupo parcial nos permite estudiar las variaciones que entre las unidades se 
presentan. El grupo parcial nos permite conocer lo normal, lo tipico y lo anormal o atipico. Luego gene- 
ralizaremos ambos conocimientos: el normal y el anormal. A este sistema se le llama hoy encuesta. 

La E ncuesta , es pues, una investigacion estadistica parcial o incompleta cuando recoge datos nume- 
ricos y deja de ser una investigacion estadistica propiamente dicha, aun cuando luego pueda someterse a 
un recuento o elaboration estadistica, cuando se limite a anotaciones literarias. Ejemplo de estas ultimas 
son las que suelen organizar los periodicos y revistas, y muchas instituciones profesionales y tecnicas; 
preguntan el parecer, la opinion, por ejemplo, sobre la situation economica, sobre temas de la politica, de 
los deportes, aficiones y gustos artisticos, etc. 

Alas encuestas se les suele dividir, en cuanto al organismo que las realiza, en: privadas y publicas , 
y a estas ultimas en parlamentarias y estadisticas. 
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Las encuestas privdddS son muy corrientes en los paises anglosajones en donde existe una inclina- 
cion grande entre el publico a dar respuesta a las preguntas de una encuesta. Son menos frecuentes en los 
paises latinos. La prensa, con el objeto de pulsar la opinion y dar la publicidad y las entidades cientificas 
privadas, con el proposito de alcanzar avances en las ciencias, organizan esta clase de investigaciones. 

La distincion de las encuestas publicas y oficiales , en parlamentarias y estadisticas , se funda, prin- 
cipalmente, en el habito de los sistemas democraticos de estudiar la realidad de los problemas sobre los 
cuales tiene que legislar. Asi, el Congreso, Asambleas, los Concejos, encargan a sus miembros realizar 
encuestas alrededor de los topicos de discusion. Por lo general los senadores, representantes, diputados, 
concejales, buscan interrogar a las personas interesadas, a observar visualmente la realidad y luego infor- 
man. 


La Estadistica, por el contrario, recoge datos numericos, realiza anotaciones. Son ejemplos cons- 
tantemente repetidos, las encuestas sobre ingresos y gastos que llevan a cabo en casi todos los paises, asi 
como otras sobre problemas sociales. 

La sociologia emplea de ordinario el sistema de observacion por encuesta. 

En cuanto al procedimiento de recoger los datos y hacer las preguntas de una encuesta, se distin- 
guen dos: orales y escritos. 

Las encuestas parlamentarias, por lo regular son orales. Las estadisticas tienen que ser escritas. 

Las escritas, unas veces se organizan repartiendo cuestionarios entre el publico en general, para que 
quien desee las responda. 

Otras veces se remiten los formularios ex profeso a determinadas fuentes de informacion, determi- 
nadas personas, entidades, empresas, que se consideran de interes o representativas de su sector. Tambien 
se utiliza el metodo de agentes investigadores, (reportajes) que acuden personalmente al campo de la ob¬ 
servacion con el cuestionario a recoger los datos y opiniones. 

Las encuestas suelen ser muy frecuentes en los periodos dificiles, en las crisis economicas o cuando 
se agudiza un problema social o economico, huelgas, epidemias, plagas en la agricultura, alzas de pre- 
cios, de empleo, pliegos de peticiones obreras, alzas de impuestos, etc. Por eso resultan investigaciones 
ocasionales. 

Las diferencias con la investigacion estadistica propiamente dicha, son las mismas que hemos se- 
nalado para las monografias, con la particularidad de que en la encuesta se observa un mayor numero de 
casos y suelen emplearse para conocer opiniones de personas o entidades en una materia. 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

1. ^Cuales son los nuevos terminos aprendidos en este capitulo? 

2. ^Que significado tiene cada uno de los terminos recordados? 
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3. Ilustrar con ejemplos lo que se entiende por poblacion, poblacion finita, poblacion infinita, muestra, 
caracteristica, variable. 

4. Mediante ejemplos, explicar la diferencia entre la estadistica descriptiva y la estadistica inductiva. 

5. ^Por que es util la estadistica en el campo para el cual se esta preparando? 

6. Dar como minimo tres ejemplos de fenomenos economicos, considerados dentro del campo de la 
investigacion estadistica. 

7. Dar tres ejemplos de fenomenos no considerados dentro del campo de la estadistica. 

8. “La estadistica estudia el comportamiento de fenomenos colectivos y nunca de una observacion 

individual”. Comentar este principio. 

9. Senalarel literal que mas concuerde con cada una de las siguientes aseveraciones. 

9.1 Una buena muestra industrial debe ser: 

a) Pequena. b) Grande. 

c) Representativa de la poblacion objetivo. d) Incluir solo los establecimientos grandes. 
e) Incluir solo los establecimientos pequenos. 

9.2 La clasificacion de los establecimientos dedicados al comercio al detal se hace teniendo en 
cuenta: 

a) Su funcion. b) El valor de las ventas. 

c) El valor de la produccion. d) El valor del trabajo realizado. 

9.3 Una poblacion infinita es aquella en donde: 

a) El numero de elementos esta completamente delimitado. 

b) El numero de elementos pasa de 1.000. 

c) El numero de elementos esta escondido. 

d) El numero de elementos no esta delimitado. 

10. Contestar verdadero o falso, segun el caso: 

a) La palabra poblacion, significa en la metodologia estadistica lo mismo que en cualquier otra 
disciplina. 

b) La teoria estadistica es de naturaleza general y puede aplicarse a cualquier campo del 
conocimiento. 

c) A las medidas que se obtienen de una muestra, se les da el nombre de parametros, mientras 
que a las obtenidas de una poblacion se les denomina estadigrafos. 

d) Se conoce como fuente primaria, aquella informacion que se obtuvo inicialmente, es decir 
directamente de la persona, empresas o entidad investigada. 

e) Una muestra aleatoria, es aquella en la cual ciertos elementos tienen mayor posibilidad que 
otros de ser seleccionados. 
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11. Senalar el literal mas adecuado para las siguientes observaciones: 

11.1 La investigacion preliminar permite: 


a) Establecer la hipotesis. 
c) Coordinar el personal de campo. 


b) Determinar la muestra. 
d) Ninguna de los anteriores. 


11.2 Antes que nada, la investigacion estadisticarequiere 


a) Que exista un objetivo. 
c) Que se tenga un problema. 


b) Que se hayan trazado planes, 
d) Ninguna de los anteriores. 


11.3 El costo de una encuesta, por correo, es generalmente: 

a) Igual al de una encuesta por medio de entrevistas personales. 

b) Mayor al de una encuesta por medio de entrevistas personales. 

c) Menor al de una encuesta por medio de entrevistas personales. 

d) Imposible de medir en relacion con el costo de una encuesta por medio de entrevistas 


personales. 


11.4 En el diseno del cuestionario, las preguntas mas dificiles deben colocarse: 

a) Al principio, para salir inmediatamente de la parte mas dificil. 

b) En el centro para que sean precedidas y seguidas por preguntas faciles. 

c) Al final, luego que se haya establecido un clima de confianza, al comenzar por las mas faciles 

hasta llegar a las dificiles. 

d) Ninguna de los anteriores. 

12. Contestar verdadero o falso, segun el caso: 

a) Codigo es la representacion cualitativa de un hecho cuantitativo. 

b) Despues de elaborar el formulario se define el objetivo de la investigacion. 

c) Al recolectar informacion por medio de entrevistadores se tiene la ventaja de que estos pueden 

observar el sitio de la operacion que se esta llevando a cabo. 

d) Se conoce como fuente primaria, aquella que obtuvo inicialmente la informacion directamente 
de la persona o entidad. 

e) Al disenar un cuestionario no es de gran importancia la forma de hacer la pregunta, siempre 
que esta sea clara. 

f) No hay posibilidad alguna de que en una encuesta, por correo, se interpreten mal las preguntas 

de un cuestionario, siempre y cuando la persona que la reciba sepa leer. 

g) El examen de la documentacion y metodologia se efectua despues de tabulada la informacion. 

13. Se ha dicho que en una investigacion se consideran tres etapas; las que a su vez se subdividen en 
otras fases. ^Cuales son? ^Podria usted reagrupar los titulares de este capitulo en un indice de temas 
de acuerdo con estas etapas? 

14. Mencionar algunos aspectos tecnicos y materiales que deben tenerse en cuenta en el diseno de un 
formulario. 

15. Un ejemplo de caracteristica cualitativa pueden ser datos sobre: 

a) Salarios b) Pulsaciones por minuto c) Gasto mensual en alimentacion. 

d) Ocupacion e) Temperatura. 
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16. Una muestra es aleatoria cuando las unidades se seleccionan: 

a) En forma caprichosa. b) Por conveniencia. 

c) A traves de un censo. d) En forma repetitiva. 

e) De tal manera que todas tengan la misma posibilidad. 

17. Por poblacion o universo se entiende: 

a) Un recuento de unidades. 

b) Un conjunto de seres humanos. 

c) Un conjunto de datos. 

d) Un conjunto de medidas o el recuento de todas las unidades que tienen una caracteristica 
comun. 

e) Ninguna de las anteriores. 

18. Cualquier medida aplicada a la caracteristica de las unidades en la poblacion se denomina: 

a) Parametro. b) Estimador. 

c) Estadistico. d) triable, 

e) Poblacion. 

19. Dentro de los hechos o fenomenos que no caen dentro del campo de la estadistica estan: 

a) Los de frecuente repeticion. b) Los de distinta frecuencia. 

c) Los colectivos. d) Los individuales. 

e) Los cualitativos que pueden cuantificarse. 

20. La estadistica descriptiva tiene como objetivo: 

a) Probar la significacion de los resultados. 

b) Ser herramienta indispensable en el muestreo. 

c) Descubrir las causas que originan el hecho. 

d) Lograr conclusiones mas alia de las muestras. 

e) Efectuar comparaciones sin sacar conclusiones de tipo mas general. 

21. Se debe responder verdadero si el enunciado es siempre valido. En caso contrario, se debera sustituir 
la palabra SU bray ad a por otra, con la cual el enunciado tenga validez. 

a) Parametro, es el resultado al aplicar una medida a las caracteristicas de las unidades de una 

poblacion. 

b) El recuento de los empleados de una empresa, de acuerdo al cargo, es un ejemplo de caracteristicas 

cuantitativas. 

c) La estadistica descriptiva, es el “estudio” de una muestra para hacer estimaciones acerca 
de los valores estadisticos de la poblacion, de la cual se tomo la muestra. 

d) Una muestra aleatoria significa que, cada elemento tiene una probabilidad di ferente al ser 
seleccionado. 

e) La inferencia, es un ordenamiento sistematico de la informacion en cuadros y graficas que 
observamos en las diferentes publicaciones e informes. 

22. Explique brevemente los siguientes puntos. 

a) Factores o impedimentos que obligan a realizar una investigacion parcial, en vez de una 
investigacion total. 
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b) Marco muestral. 

c) Hechos que abarca y no abarca la estadistica. 

23. En los tres (3) ejemplos siguientes, determinar en cada uno de ellos ^cual es la poblacion?; ^cual es 
la muestra?; ^cual es la unidad?; ^cual es la caracteristica?; ^cual es cualitativao cuantitativa?; i cual 
de las variables es discreta o continua? 

a) Se realiza un estudio en 350 hogares de la clase media de la ciudad Bellavista para conocer el tipo 
de aceite o grasa usada en la cocina. Los resultados fueron: 130 hogares utilizan el ajonjoli; maiz 
en 90 hogares; girasol en 75 hogares; etc. 

b) El laboratorio de control de calidad de una empresa realiza un test de rapidez de action de un 
pesticida de jardin, en 50 plantas infestadas. Los resultados fueron observados cada hora, habiendose 
obtenido algunos datos del numero de plantas totalmente libres de plaga, despues de los periodos de 
tiempo que se indican: 6 horas, 6 plantas; 7 horas, 9 plantas; 8 horas. 5 plantas; etc. 

c) En un plantel de 800 ninos de ambos sexos, de 5 a 12 anos, se realizo un test de aceptacion a 
20 ninos, utilizando una escala de 10 puntos, para medir el grado de aceptacion de un nuevo 
producto que fabrica la compania Chocolatera laAvispa S.A. 

24. Diga brevemente que diferencia hay entre: 
a) Parametro y estimador 
c) Atributo y variable 

25. Que entiende usted por: 
a) Estadistica 

c) Fuentes o estadisticas primarias 
e) Estadisticas intemas y extemas 
g) Obj etivo de la investigation 
i) Muestreo aleatorio y no aleatorio 


b) Poblacion y muestra 
d) Muestreo aleatorio y no aleatorio 

b) Estadisticas 

d) Fuentes o estadisticas secundarias 
f) Unidad o elemento 
h) Proceso de recoleccion 
j ) Encuestas y monografias. 



Existe una diferencia entre los terminos estadistica y estadisticas ; la primera se refiere 
a la tecnica de recoleccion, procesamiento y analisis del dato, la segunda, corresponde al 
ordenamiento sistematico de la information en forma de cuadros y graficas que aparecen en 
publicaciones. 

La estadistica cumple dos funciones: a) la primera, de analisis descriptivo en forma cuantitativa 
de las caracteristicas observadas en el fenomeno, y b) la segunda, infer end a estadistica o 
induction, lograndose generalizaciones para un grupo mayor denominado poblacion, partiendo 
de un grupo menor o muestra. 

Se dan una serie de terminos estadisticos que hay que conocer para un buen desarrollo del 
curso de estadistica, entre otros: poblacion, muestra, variables y atributos. 

Se considera que la finalidad de la estadistica, por ejemplo, en una empresa es suministrar 
informacion que permita: a) tener una vision general de ella en su conjunto, para que la 
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administracion pueda formular directrices con pleno conocimiento de causa; b) descubrir las 
relaciones de causa a efecto en las diversas manifestaciones economicas de la empresa; c) 
reconocer y separar, en vista del control, lo normal y anormal, observando las fluctuaciones 
internas ligadas estrechamente con las condiciones extemas, para obtener una mayor 
orientacion a la actividad de la empresa. 

Tambien, se establecen las condiciones que deben presentar los fenomenos para que sean 
considerados dentro del campo de la estadistica 

El campo de accion de la Estadistica es muy amplio; sin embargo, no todos los fenomenos son 
abarcados, unicamente aquellos que reunen ciertas condiciones, a saber: fenomenos colectivos 
o de grupos; de frecuente repeticion; de distinta frecuencia; distantes en el espacio; distantes 
de tiempo; cualitativos que pueden cuantificarse. 

En cambio, quedan fuera del campo de accion de la estadistica, los enumerados a continuacion: 
Fenomenos individuales; que no se exteriorizan; accidentales en el tiempo y en el espacio; 
cualitativos que no pueden cuantificarse. 

Son numerosas las finalidades de la estadistica; entre las mas importantes podemos anotar: 

Conocer la realidad acerca de un fenomeno; determinar lo que sea normal o tipico; observar los 
cambios que presentan; relacionar dos o mas hechos; determinar las causas que originan; hacer 
estimaciones sobre el comportamiento futuro; partiendo de un grupo menor, obtener conclusiones 
para un grupo mayor (inferencia estadistica). 

En esta unidad se quiere resaltar, que no todas las investigaciones son indispensables de ser 
llevadas a cabo, debido al hecho de que en, algunos casos, se dispone de informacion obtenida 
de investigaciones realizadas con anterioridad, por la misma entidad o por otras entidades. En 
otras ocasiones, dicha informacion puede ser considerada como complementaria a la nueva 
investigacion. 

Una investigacion requiere en la primera etapa, ante todo, de un planeamiento que comprenda: 

■ Fijar los objetivos de la investigacion, determinando si el fenomeno puede ser 
observado mediante la aplicacion de metodos estadisticos. 

■ Establecer la unidad o unidades de observacion 

■ Determinar, si se trata de un censo o de una muestra. 

■ Si la encuesta se va a hacer mediante entrevista, entrega personal del cuestionario, por 
correo, telefono, observacion, panel, internet, fax, etc. Elaborar el presupuesto. 

■ Disenar el calendario de trabajo. Disenar el formulario e instrucciones. 

■ Seleccionar y capacitar a las personas que van a trabajar en la investigacion. Hacer 
una preencuesta. 

■ En la segunda etapa, le corresponde como actividad la recoleccion. 
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■ Distribucion y recoleccion de formularios. 

■ \ferificaci6n del numero de formularios enviados y recogidos. Efectuar un control 
sobre la calidad de los datos. 

La tercera y ultima etapa comprende: la sistematizacion, analisis y presentacion de los 
resultados 

■ Elaboracion de codigos. 

■ Critica y codificacion 

■ Elaboracion de cuadros de tabulacion. 

■ Seleccion del proceso de tabulacion, si es manual, mecanico o computarizado. 

■ Elaboracion de cuadros y graficas. 

■ Analisis y comparacion de los datos. 

■ Publicacion. 

Las estadisticasy la estadistica, que para muchos significan lo mismo, son terminos empleados 
frecuentemente, siempre vinculados a cifras que miden algo. Asi oimos hablar de la inflacion 
mediante el crecimiento del indice de precios al consumidor, lo mismo de la tasa de desempleo 
o de criminalidad, llegando al extremo de desafiar y criticar duramente esas cifras, sin tener 
medianamente conocimiento de como fueron obtenidas ^Cual fue el procedimiento utilizado? 
^Que significado tienen? y algo mas, no pensamos si la interpretacion dada es la correcta. 
Todo esto nos muestra lo poco que sabemos de esta herramientapara la interpretacion y analisis 
de una informacion. 

Por la anterior razon, se comenzo por definir aquellos terminos que son indispensables para 
entender la teoria estadistica, tales como poblacion, unidad, muestra, caracteristica, etc., que 
a primera vista parecen sencillos, en algunos casos resultan complejos. \bamos, en el salon de 
clase se dice que se va a realizar una encuesta a un grupo de familias de un barrio determinado 
de la ciudad, preguntemosle al estudiante: ^Que se entiende por familia, como unidad de 
investigacion? resultando, un termino definido de diferentes maneras. El investigador 
seguramente ha tornado alguna de ellas, desgraciadamente algunos de los que proporcionan 
informacion estadistica no definen los conceptos que supuestamente miden, prestandose a 
muchas interpretaciones con los resultados presentados. 

La parte metodologica, en la ensenanzade la estadistica, parece que ha perdido su importancia 
si observamos el desarrollo y contenido de los de programas, lo cual podemos constatar 
en los ultimos programas academicos. Se ha despertado un gran interes por la aplicacion de 
modelos matematicos que solo son parte del proceso, algunos se centran en deducciones y 
comprobaciones, en vez de ayudar a comprender la estadistica, solo se ha logrado aumentar el 
grado de dificultad en su aprendizaje, dejando a un lado el conocimiento de la importancia que 
tiene la etapa de planeacion y de recoleccion para producir una informacion consistente, que 
permita la aplicacion de los metodos estadisticos tanto descriptivos como los de inferencia, 
a fin de realizar un buen analisis de los resultados y cumplir con los objetivos propuestos. 












Distribuciones 

de 

frecuencias 


El fin primordial de la educacion es 
formar los hombres capaces de hacer 
cosas nuevas y no de repetir simplemente 
lo que otras generaciones han hecho. 

Jean Piaget 
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CONTENIDO 

■ 

Elaboracion de tablas o cuadros de 
frecuencias. 

■ 

Elaboracion de graficos aplicados a la 
teoria estadistica. 

■ 

Elaboracion de graficas generalmente 
utilizadas en informes. 

■ 

Recomendaciones para la elaboracion 
de tablas y graficos. 

■ 

Sintesis del Capitulo. 

■ 

Ejercicios para Resolver, resueltos 

en el Sistema de Informacion en 

Linea SIL. 

COMPETEN Cl AS 



El estudiante debera estar en capacidad de: 

□ Seleccionar y elaborar graficas que 
visualicen mejor la informacion. 

□ Aplicar las tecnicas y recomendaciones 
en la elaboracion de tablas o cuadros. 

□ Poder analizar y sacar conclusiones 
sobre las informaciones que se tienen, 
tanto en tablas o en graficas 

□ Distinguir la importancia y diferencias 
entre el texto, cuadros y graficas. 





















44 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


GENERALIDADES 


La distribution de frecuencias , es un metodo utilizado para organizar y resumir informacion. Bajo este 
metodo, los datos recolectados se ordenan y clasifican, indicandonos la frecuencia o sea el numero de 
veces que se repiten. 

Se podra decir tambien, que nos permite manejar grandes cantidades de informacion en espacios 
reducidos, en formas de cuadros o tablas, complementadas con graficas. 

Por poblacion 0 universo, se entiende como un conjunto de medidas para ser aplicadas a una carac- 
teristica cuantitativa, o como el recuento de todas las unidades que presentan una caracteristica comun, 
siendo esta cualitativa. Tambien se puede definir a la poblacion como un conjunto de elementos o uni¬ 
dades. Lo que se estudia en una unidad o elemento son sus caracteristicas. 

Cuando se toman todas las unidades o elementos de la poblacion, se habla de una investigation ex- 
haustiva o censo. Si solo se investiga una parte, se le considera como investigation partial 0 muestra. 

La muestra, para que sea representativa de la poblacion, requiere que las unidades o elementos sean 
seleccionadas al azar, en tal forma que cada una de ellas tenga la misma posibilidad de ser seleccionada. 

Se usan letras mayusculas o letras del alfabeto griego como simbolos en poblaciones, en cambio, en 
la muestras se emplean letras minusculas. 

Los caracteres de los elementos de una poblacion pueden ser cualitativos 0 cuantitativos , Los datos 
cualitativos, denominados tambien atributOS , son todos aquellos elementos que pueden ser descritos 
cualitativamente, es decir mediante palabras; son ejemplos de atributos: la clasificacion de los alumnos 
de una universidad por lugar de origen; clasificacion de un grupo de personas por ocupacion, por cargo, 
por sexo, etc. 

Los caracteres cuantitativos denominados variables , son todas aquellas caracteristicas susceptibles 
de ser expresadas cuantitativamente, es decir, mediante numeros. Ejemplo: peso, estatura, edad, numero 
de hijos, salarios, etc. 

Las variables se dividen en discretas y continuas. Es de tener en cuenta que esta clasificacion tiene 
mas valor teorico que practico. 

Las variables discretas son aquellas que admiten solamente valores enteros, es decir, no tienen 
valores intermedios. Ejemplo: el numero de hijos por familia sera discreta, ya que no se podra decir que 
una familia tiene dos hijos y medio; el numero de empleados por departamento en una empresa, etc. 

Las variables continuas son aquellas que admiten valores fraccionarios, pudiendose establecer in- 
tervalos. Ejemplo: la estatura de una persona que mide un metro con setenta centimetros; que pesa sesen- 
ta kilos, una libra y cuatro onzas, etc. 


Nota: Se hara un pequeno resumen sobre aquellos terminos que mas seran utilizados en los 
capitulos posteriores y que fueron presentados en forma amplia en el anterior capitulo. 
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ELABORACION DE TABLA DE FRECUENCIAS 


VARIABLE DISCRETA 

Ante todo es conveniente familiarizarnos con ciertos simbolos que utilizaremos tanto para la variable 

discreta como para la variable continua. 

r n n = 

n 

= Tamano de la muestra. 

1 N 1 = 

N 

= Tamano de la poblacion o universo. 

1 X < 1 = 

x, 

= Identificacion para cada valor observado. 

(minuscula en la muestra) 

1 f, l = 

n. 

= Frecuencias absolutas. 

1 1 = 

hi 

= Frecuencias relativas. 

1 Fi 1 = 

Ni 

= Frecuencias absolutas acumuladas. 

H, = 

1 | 

Hi 

= Frecuencias relativas acumuladas. 

I X, 1 = 

y, 

= Identifica la variable discreta o las marcas de clase en la continua. 

II 

>< 

>< 

y'/.i-y', 

= Identifica a la variable continua con sus intervalos. 

1 ' 1 = 

c 

= Amplitud del intervalo 

m 

L J 

m 

= Numero de valores de la variable o de intervalos. 

Se ha considerado conveniente presentar las dos simbologias mas utilizadas en los textos de Estadistica, 

de tal manera que el estudiante pueda consultar o aplicar indistintamente cualquiera de ellas. 


Ejemplo 1 . Supongamos que se tiene una poblacion constituida por 2.000 cajas y deseamos examinarlas 
con el fin de determinar el numero de piezas o elementos defectuosos que contiene cada caja. Por dife- 
rentes razones, se desea que la investigacion no sea exhaustive es decir, no examinar la totalidad de las 
2.000 cajas o universo sino, por el contrario, seleccionar una muestra de tamano 30, correspondiente a 
una investigacion parcial. N = 2.000 D = 30 


Los resultados obtenidos en esta encuesta, se anotan a continuacion. Siendo x 1? la primera caja exa- 
minada y 3, el numero de piezas defectuosas encontradas en ella y asi sucesivamente: 


m 

II 

*T 

(N 

II 

xT 

x 3 =0 

(N 

II 

X 

x 5=3 

X 6= 3 

X 7 = 1 

X = 1 

II 

o 

JX 

o 

II 

x„=3 

x 12 =3 

X 13 = 4 

X, 4 = 4 

x i=3 

X 16= 2 

X 17= 4 

X 18= 2 

_x 

II 

4^ 

X 20= 2 

x 2 = 4 

x 22=° 

X 23 = 0 

X 24 = 1 

x 25=3 

X 26= 4 

X 27 = 2 


En la anterior informacion o conjunto de datos, observamos que no estan ordenados y los denomi- 
namos datOS originates o no ordenados. Quizas, dado que la muestra es muy pequena, podemos damos 
cuenta, en forma muy ligera del comportamiento de la caracteristica. Pero si en vez de tener 30 obser- 
vaciones, fueran 200 o 2.000 es muy poco lo que podemos decir o conocer de la variable; por lo tanto 
se hace necesario el ordenamiento o la clasificacion de esos datos, mediante un proceso que llamaremos 
tabuiacion o procesamiento de datos. 
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En primer lugar, se determinan los valores que toma la variable, en cuanto al numero de piezas de- 
fectuosas, siendo en este caso de 0 1 2 3 4. Tambien se hubiera podido establecer los valores 

extremos (0 y 4) y luego los valores intermedios (1, 2, 3); procedemos en seguida al conteo, a fin de 
determinar cuantas veces se repite cada valor de la variable, resultados que denominaremos frecuencidS 


o frecuencias absolutas. 


Tabla 2.1 Tabulacion 


NUMERO 

DE PIEZAS 

NUMERO 

DE CAJAS 

0 

4 

1 

5 

2 

7 

3 

8 

4 

6 

E 

30 


TABULACION 

A 

B 

INI 

□ 

M 

0 

null 

0L 

Will 

0U 

m\ 

IZI 1 

30 

30 


En el ejemplo 1 de la Tabla 2.1 se puede inter¬ 
pretar, diciendo que en la muestra de 30 cajas encon- 
tramos cuatro de ellas sin piezas defectuosas; 5 cajas 
con una; 7 cajas con dos; 8 cajas con tres; y 6 con 
cuatro piezas defectuosas. Sin embargo, a veces, es 
mejor expresarlo en terminos porcentuales, diciendo 
que el 13% de las cajas examinadas no tenian piezas 
defectuosas, que el 17% tenian una; que el 23%, dos; 
el 27%, tres; y el 20% con cuatro piezas o unidades 
defectuosas, como se puede observar en el cuadro si- 
guiente: 


Se recomienda formar grupos de cin- 
co, 1444 H-H H-H 111 que nos representara 18 
observaciones, siendo mas facil contar de 
cinco en cinco, que hacerlo de uno en uno, 
IIIII 11 IIIII 11 III III. Tambien se pueden formar 
cuadros de cinco, lo cual nos quedaria asi: IZI 
0 0 U para un total de 18. 

En el caso en que la variable no emplee 
valores en forma continua, solamente se debe 
considerar en la distribucion aquellos que 
aparecen en la base de datos, como se puede 
observar en la Tabla 2.2, donde se omiten los 
valores 2 4 6 7 y 9. 


Tabla 2.2 Distribucion de frecuencias 


NUMERO 
DE PIEZAS 
DEFECTUOSAS 

0 

1 

3 

5 

8 

10 


Tabla 2.3 


Distribucion de frecuencias - variable discreta 


y, 

", 

h, 

N, 

H, 

0 

4 

0,13 

4 

0,13 

1 

5 

0,17 

9 

0,30 

2 

7 

0,23 

16 

0,53 

3 

8 

0,27 

24 

0,80 

4 

6 

0,20 

30 

1,00 

E 

30 

1,00 

- 

- 


fi 

f,M 

F 

H, 


y, 

", 

F 



y i 


A, 

"x 

", 

y 2 

"i 

F 

H 2 

H2 


"} 

K 

H } 



«4 




Ts 

"i 

F 

*5 

» 5 

i 

n 

1,00 

- 

- 


f, 

fjn 

F, 

H, 
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Las frecuencias relativas se obtienen de la siguiente manera: 


r,n r n 

*,=-=|-| h 2 =^= 

n n n , n , 


l”j 


r/i 

=^ = |A| 

w , n . 




=^=|A| 




-=0,I7 ...etc. 


I "/" 1 

*5 = ^=1^1 


Las frecuencias absolutas acumuladas las utilizaremos mas adelante para el calculo de algunas 
medidas. Se obtienen asi: 



— 

= N^n { =4 

N 2 = n+n 2 


= N t + n 2 = 4 + 5 = 9 

N , = ", + ” 2 + ”, 

— 

= N,+n\ =9 + 1=16 

= w, + n 2 + W 3 + /; 4 

—^ 

= N\ + n 4 =16 + 8 = 24 

= w, + n 2 + w 3 + + n. 


= /V 4 + /?, = 24 + 6 = 30 



—- 

= f> 



= F 1+ f 2 

^3 =/+/+/, 

-► 

= f 2+ f 3 

FrA + A + f, + f< 

-► 

= f 3 + f 4 

FrM+fSfSf, 

- 

= F 4 + f 5 


Las frecuencias relativas acumuladas resultan asi. 


H l =h l 

—^ 

= H=h= 0,13 


H 2 = h, + h 2 

—>~ 

= H+h = 0,13 + 0,17 = 0,30 


H } = h t + h 2 + h } 


= H+h= 0,30 + 0,23 = 0,53 


H A = h t + h 2 + h 3 + h A 

—^ 

= H\+h= 0,53 + 0,27 = 0,80 


//< = /?, + /? 2 + A 3 + // 4 + 

—^ 

= //, + /> 5 p 0,80 + 0,20= 1,00 



Ejemplo 2. Con la informacion de la tabla No. 2.3 determinar los valores que toma: 
Solution 


l- 1 

y 3 - X, - 2 

3 l_ _J 

ry 1 

H, = |—= 0,53 

' L«J 


I-1 

N 2 =f 2j = 9 
r n 

h 4 = |—1= 0,27 

L«J 


II-1 

n s = f 5 = 6 

5 li 5 j 


X| 6 2 


VARIABLE CONTINUA 


Ejemplo 3. Consideremos que se selecciono una muestra de 30 alumnos, a fin de conocer su peso en 
kilos; para facilitar el trabajo redondeamos las cifras. 


II 

X 

x 2 =67 

X 3 = 94 

-v, = 70 

JC 5 = 69 

*6 =61 

r- 

II 

r- 

X 

*« = 79 

r-* 

^r 

II 

OO 

II 

o 

X 

*ii = 82 

x, 2 = 55 

x l3 = 65 

* 14 = 88 

*,5=52 

*■6 = 58 

*■7= 7 6 

*is= 57 

X\ 9 72 

x, 0 =66 

*21= 48 

* 22 = 56 

jc 23 = 63 

^4= 71 

x 25 = 60 

*26= 64 

x 27 = 68 

00 

II 

oo 

x 29 =14 

■*‘ 30 = 92 
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El primer paso a seguir consiste en determinar el valor maximo y el minimo que toma la variable. 
En este ejemplo tenemos: x = 94 y x . = 47. La diferencia entre el valor maximo y el minimo se 

J 1 max J min J 

denomina recorrido. En el presente caso el recorrido es de 47. 


x , - x , = Recorrido o rango 

max mm 0 

94 - 47 = 47 


Introducimos dos nuevos simbolos que son: m = numero de intervdtos y 
C = amplitud del intervalo = [/] 

El valor de 171 se puede determinar de varias maneras: 


■ Un numero arbitrario que sea mayor o igual a cinco, y menor o igual a 16 

5 < m < 16 6 5 < m < 18 

■ Metodos muy utilizados en clase, consiste en la aplicacion de la formula Sturges 

m = 1+3,3 log n 

■ De acuerdo a la clasificacion que requiera la variable o la forma en que se ha venido 
presentando la informacion. 

■ Algunos utilizan un procedimiento, no muy recomendado, calculando m mediante 
la formula m = log n 


En la practica, se determina 171 atendiendo a varios factores, tales como: finalidad del estudio, grado 
de variabilidad de los datos, necesidad de efectuar comparaciones con otros estudios que obligue a man- 
tener los intervalos y su numero. Sin embargo, se recomienda que el numero de intervalos, hasta donde 
sea posible, no sea menor de 5 ni mayor de 16. Algunos lo admiten hasta 18. 

En este ejercicio se tendra que 171 = 1 + 3,3 log 30 = 5,29 ^ 6, lo aproximamos a 6, pero se hubiera 
podido considerar que m = 5. La aproximacion no tiene importancia alguna en estos casos. Esta formula 
recibe el nombre de Sturges, su descubridor. 

En cuanto la amplitud [C] o r J que debe tomar cada intervalo de la distribucion, dependera del 
criterio establecido para presentar la informacion. Puede variar el valor de la amplitud para cada inter¬ 
valo, sin embargo en clase y con fines de explicacion es mejor trabajar con una amplitud constante, para 
ello se tendra que: 


i =C = 


Rango 

m 


Reemplazando se tiene que: 

C = 47 A 6 = 7,83. Siempre aproximamos al numero inmediatamente 
superior, por pequena que sea la fraccion. Si C hubiese resultado 7,06 o 
7,10, se aproxima a 8. Si usted no aproxima al numero superior por pequena 
que sea la fraccion al calcular amplitud, es muy posible que le queden valores 
observados por fuera del rango. 
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Para nuestro ejercicio fijamos HI igual a 6, con lo cual podemos determinar el valor de [CT] = J ] 

97- 47 47 



C= 


7,83 


C= / 


7,83^8 


Siempre que el resultado de C sea un valor entero con alguna fraction, por pequena que esta sea, 
debe ser aproximada siempre al valor inmediatamente superior; segun esto, el valor de C sera de 8, con 
el cual el recorrido se aumenta en una unidad, puesto que 6 x 8 = 48. La unidad de incremento se le pue- 
de restar al limite inferior o aumentarse al limite superior. En este caso se lo restamos a 47, quedando el 
limite inferior en 46, a partir de este valor comenzamos a agregar el valor de C, para formar los distintos 
intervalos. 


En la variable continua. Se designa con y, _ i - / 


a los distintos valores que toma la variable. Al primer valor y) 
del intervalo y \Y\_ 


6 


yu 

6 

V-i 


se denomina limite inferior 
al limite superior; la diferencia entre estos limites corresponde al valor de la 
amplitud del intervalo [C^ 6 [T]. Es preferible con fines de trabajo, que la amplitud sea constante, sin 


embargo, en la practica no es muy frecuente que esto se presente. 


La tabla de frecuencias para este ejercicio nos quedara de la siguiente forma: 


Tabla 2.4 


Distribution de frecuencias - variable continua 


y\-i- y\ 

n. 

i 

h. 

i 

N. 

l 

H 

l 

y, 

46,1-54 

3 

0,10 

3 

0,10 

50 

54,1-62 

6 

0,20 

9 

0,30 

58 

62,1-70 

8 

0,27 

17 

0,57 

66 

70,1-78 

6 

0,20 

23 

0,77 

74 

78,1-86 

4 

0,13 

27 

0,90 

82 

86,1-94 

3 

0,10 

30 

1,00 

90 

X 

30 

1,00 



- 

xi,-x; 

f, 

V". 

F, 

H; 



yi-i- y\ 

n. 

i 

y'o - y[ 

y 2 

y\ - y’i 

y 2 

y\ - y\ 

y 3 

y\ - y\ 

y 4 

y\ ~ y’ s 

y 5 

y's - y’e 

y 6 

X 

- 

xi,- x; 

f, 


Es de anotar que a cada limite inferior del intervalo se le ha agregado 0,1, lo que permite una facil 
tabulacion y asi se sabe a cual intervalo corresponde el valor de X /? obtenido. El 0,1 se omitira para el 
calculo de las marcas de clase y de los diferentes estadigrafos o medidas que se requiera calcular. 

El cuadro de tabulacion con el cual se elaboro la tabla de frecuencias, se establecio de la siguiente 
forma: 
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Tabla 2.5 


Tabulaciones de datos - variable continua 


y\-i- y\ 

n. 

i 


TABULACION 

A 

B 

46,1-54 

3 


U 

III 

54,1-62 

6 


01 

m\ 

62,1-70 

8 


0U 

Will 

70,1-78 

6 


01 

Wl 

78,1-86 

4 


□ 

INI 

86,1-94 

3 


u 

in 

X 

30 


30 

30 


Las marcas de clase se pueden obtener de 3 maneras: 

a) Se promedia cada intervalo, de la siguiente forma: 


L J 
II 

v -*»’ 


46+54 

y\ - 

2 

2 

r n 

*2 = 
L J 

v - * 

+L> 

54+62 

yi - 

2 

2 

II 

J 

yi 

+ yi 

62+70 

y-i - 

2 

2 

r n 

* 4 = 
i i 

yi 

+ l 4 

_ 70+ 78 

)>4 ~ 

2 

2 


50 = 


58 = 

66 = 

74 = 


i- - ~i 

l *n+*. I 

2 

2 ! 

2 

i x; + *; i 
i 2 i 

] xj + x 4 1 


etc. 


b) Se obtiene la primera marca de clase por el metodo anterior y si la amplitud C es constante, se 
le suma a la primera marca de clase obtenida y asi sucesivamente. 


46+ 54 = 50 Jidii 
2 2 L 2 


i i i—i 

;I* 2 I=* 2 =50 + 8 = 58 l*J =*,=58 + 8 = 66 
I—I l l 


c) Se divide la amplitud de cada intervalo por dos y se le suma al limite inferior del intervalo o se 
le resta al limite superior del intervalo. 



y °*i 



r X^= y x = 46 + 4 = 50 
y\ = 54 - 4 = 50 


F X?= y, = 54 + 4 =58,e/c. 

L 2j 72 

^2j ~ yi = 62 - 4 =58, e/c* 


Nota: una distribucion es simetrica cuando las frecuencias absolutas o relativas, equidistantes a un 
punto central son iguales, ademas, la grafica que la representa tiene forma acampanada o convexa 
como se observa con los datos que se presentan a continuacion: 
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Tabla 2.6 


A continuacion se presenta dos ejemplos de Distribuciones simetricas: 


yi-i-y) 

", 

h, 

46,1-54 

2 

0,05 

54,1 -62 

6 

0,15 

62,1 -70 

12 

0,30 

70,1 -78 

12 

0,30 

78,1-86 

6 

0,15 

86,1 -94 

2 

0,05 

Z 

40 

1,00 

X]. x -X] 

f, 

./> 


y, 

"/ 

h 

2 

2 

0,10 

4 

5 

0,25 

6 

6 

0,30 

8 

5 

0,25 

10 

2 

0,10 

Z 

20 

1,00 

V, 

/, 

fi/n 


Propiedades de las frecuencias 

■ Las frecuencias absolutas son siempre valores enteros. 

■ La suma de las frecuencias absolutas es igual a D. 


n 


-n 


,=i 



£ A? = A? =A7, + A? 2 + A7 3 +A7 4 -f/7 5 = A7 
/=! 


I w, =30 = 4 + 5 + 7 + 8 + 6 = 30 

/=! 


1 " r I 

' Z / =" I 
i ,=i i 


2 / -/i +/ 2 +/ 3 +/ 4 +/ s =« 

/=l 


I 

I 

I 

I 



=30 


i 

i 

j 


■ Las frecuencias relativas son siempre valores fraccionarios. 


0 <h, <1 


! 0 <f/n<\ 

I- — — — — — — — 


I 

I 


La suma de las frecuencias relativas es igual a 1 


E/r =1 


Ythj = Aj + /i 2 +/7 3 + +/? 5 =1 


/=! 


E h, = 0,13 + 0,17 + 0,23 + 0,27 + 0,20= 1,00 


£//«=!' 


£ f/n = A + Al + Jl + Jl + Jl=\ 

j=\ ' n n n n 11 


El ultimo valor de las frecuencias absolutas acumuladas es igual a fl. 
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N m =n 


N s =n 30 = 30 


F,„ =n 


Fc =n =30 


El ultimo valor correspondiente a las frecuencias relativas acumuladas debe ser 
igual a 1. 


H, =1 

H. =1 

Fm/ — 1 


II 

> 

m 

5 

/ n 


/ n 


Ejemplo 3. 

a. Indique dos ejemplos de distribuciones unidimensionales, dos de bidimensionales y dos de 
multidimensionales, relacionadas con la economia del pais. b.Senale cuatro distribuciones de 
variable discreta, tres de variable continua y tres de atributos. 


Solution: 



a. 

Unidimensional 

i. 

Produccion 


(univariante) 

2. 

No. de explotaciones agricolas 



3. 

Ingresos 


Bidimensional 

1. 

Produccion e inversion (bivariante) 



2. 

No. de explotaciones agricolas y hectareas cultivadas. 



3. 

Ingresos y gastos. 


Pluridimensional 

1. 

Produccion; inversion; horas laborales 


(polivariante) 

2. 

No. de explotaciones agricolas, hectareas cultivadas numero de 
obreros 



3. 

Ingreso, gasto, No. de familias 

b. 

Variable discreta 

1. 

No. de hijos por familia 



2. 

No. de hermanos por alumno. 



3. 

No. de billetes por numeracion 



4. 

No. de piezas defectuosas. 


Variable continua 

1. 

Ingresos 



2. 

Peso en Kg. 



3. 

Longitud. 

c. 

Atributos 

1. 

Exportaciones por puertos colombianos. 



2. 

Numero de alumnos por Universidad en Caracas. 



3. 

Consumo de cigarrillos por marcas. 


Ejemplo 4. 

En los ejemplos siguientes senalar con una A las series constituidas por datos cualitativos (atribu¬ 
tos) y con una V los datos cuantitativos (variables). 


Solution: 

a. Distribucion de alumnos por mes de nacimiento (A) 

b. Distribucion de alumnos por nacionalidad (A) 

c. Distribucion de profesionales por estatura y peso. (V) 

d. Distribucion de oficiales por sueldo. (V) 

e. Distribucion de accidentes por causa. (A) 


Ejemplo 5. 

Senale con C las series de variable continua y con D las de variable discreta. 
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Solution: 

a. Distribucion de obreros por salarios (C) 

b. Distribucion de fallecimientos por edades (C) 

c. Distribucion de alumnos por numero de hermanos (D) 

d. Distribucion de alumnos por estatura. (C) 


Ejemplo 6. 

Leer el siguiente texto: "Una vez recolectados los datos en forma ordenada , es necesario 
presentarlos en forma tal que se facilite su comprension y su posterior analisis y utilization. 

Para ello se ordenan en cuadros numericos y luego se representan en grdficos, para variable 

discreta mediante diagramas de frecuencias, tanto para absolutas o relativas". 

a. Formar una tabla de frecuencias absolutas (n ), segun el numero de letras que componen cada 
palabra (rr y //, debe considerarse una sola letra). 

b. Considerando el numero de letras por palabra. ^Que valor tienen X 4 X 27 X n X 34 X 2 ? 

c. En la tabla de frecuencias del punto a. ^Que valores poseen y 2 y 4 y y ? 

d. Analogamente ^Que valores poseen n 2 n 4 n y ? 

e. ^Que valores poseen h 2 h 4 h 7 ? 

f. Calcular las frecuencias relativas acumuladas (H.) y las frecuencias absolutas acumuladas (A/.). 

g. Puede ocurrir que h 4 > h 7 (en general). ^Que H 4 < H y ? 


Solution: 

X x = una = 3 letras X 2 = vez = 3 letras, etc. 



= 

3 

*n 

= 

12 

*2, 

= 

2 

*3, 

= 

7 

*4, 

= 

8 

*2 

= 

3 

*12 

— 

2 

*22 

= 

9 

*32 

— 

9 

*42 

— 

8 

*3 

= 

12 

*13 

= 

5 

*23 

= 

8 

*33 

= 

1 

*43 

= 

9 

*4 

= 

3 

*14 

= 

3 

*24 

= 

1 

*34 

= 

5 

*44 

= 

2 

*5 

= 

5 

*15 

= 

3 

*25 

= 

11 

*35 

= 

2 

*45 

= 

11 

*6 

= 

2 

*16 

= 

2 

*26 

= 

4 

*36 

= 

11 

*46 

= 

5 

*7 

= 

5 

*17 

= 

8 

*27 

= 

3 

*37 

= 

2 

*47 

= 

4 


= 

8 

*18 

= 

2 

J* 

00 

= 

2 

*38 

= 

8 

oo 

= 

9 

*9 

= 

2 

*19 

= 

11 

^29 

= 

7 

*39 

= 

4 

*49 

= 

1 

*.0 

= 

9 

^20 

= 

1 

^30 

= 

2 

*40 


8 

o 

X 

= 

9 



b) X 4 = 3 x 27 =3 x i2 = 2 x 34 = 5 X 2 = 3 


c) y 2 = 2 =jxj y 4 = 4 =Lxj y-- 8 - xI 

d) n - "'Ll. n * 3 _ \a\ n - _ 7 ■ \jA 

e) h 2 = 0,22 h 4 = 0,06 h ? = 0,14 


V =0,22 i i V = 0,06 j i / =0,14 

/n j / n | : /n 
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f) En general puede ocurrir que h 4 > h 7 6 > b 4 

Pero siempre se tendra H 4 < H 7 y nunca se dara que H 4 > H 7 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

1. En un grupo de familias considerando el numero de hijos, se han obtenido los siguientes valores: 

_ 2 0244664674474204677 _ 

Construir una tabla con base en los anteriores datos. Calcular las columnas correspondientes a: n. 
h. N. y H.. 

i i j i 

2. De contestacion a los siguientes puntos, senalando con una X si es cierto o falso. 

Cierto Falso 


a. H 5 = 0,36 A/ 4 = 30 n 5 = 6 n = 50 () () 

b. Para calcular las marcas de clase, se suma el limite inferior al superior del in- ( ) ( ) 

tervalo y se divide entre dos. 

c. El numero de accidentes segun sus causas, es una variable discreta. ( ) ( ) 

d. Si H 6 = 0,7 y H 4 = 0,3 un 40% de los valores de la variable es menor que ( ) ( ) 

Y 6 y mayor que Y 4 . 

e. H 5 = 1,10 H 4 = 0,80 h 5 = 0,30 ( ) ( ) 

f. La suma de las frecuencias absolutas es igual a 1. ( ) ( ) 

3. Reconstruya la siguiente distribucion simetrica. 



4. Se realiza un estudio en la ciudad de Guayaquil a 150 familias de clase media, para conocer el tipo 
de aceite o manteca usados en la cocina. Los resultados son los siguientes: Maiz, 14 hogares; Soya, 
65 hogares; Ajonjoli, 21 hogares; compran aceite al detal sin especificar tipo, 17 hogares; manteca 
de cerdo, 21 hogares; grasas de origen vegetal, 6 hogares; Oliva, 13 hogares. 

a) ^Cual es la poblacion? 

b) /,Cual es el tamano de la muestra? 

c) ^Que caracter tiene la poblacion? 

d) /,Cual es la caracteristica? 

e) ^Cuantas clases de caracteristicas tiene la distribucion? 

f) Construya una distribucion de frecuencias en el mismo orden indicado. 

g) ^Cual es la 5 a clase? 

h) ^Como se explica que la suma de frecuencias sea superior al numero de hogares? 
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5. Una fabrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se realiza un test de aceptacion 
de dicho sabor en una muestra de 30 ninos, utilizando una escala de 10 puntos, para medir el grado 
de aceptacion. Los puntos obtenidos en los 30 ninos fueron los siguientes: 

2 6 8 745 10 66767387686547857672727 

La muestra estuvo compuesta por igual numero de ninos de ambos sexos, de 5 a 12 anos de edad, 
residentes en el Barrio San Eduardo de la ciudad de Maracaibo. 

a) ^Cual es la poblacion? b) /,Cual es la muestra? 

c) ^Cual es la caracteristica? d) ^La caracteristica es cualitativa o cuantitativa? 

e) /,Cuantas clases tiene el atributo? f) ^Que clase de escala se ha utilizado en la medicion 

de la variable? 

g) Construya una distribucion de frecuencias 

h) ^Por que la suma de la frecuencias es diferente a 150? 


6.Contestar si son ciertas o falsas las siguientes relaciones y por que. 


m = 6 

h, = 0,2 

K = 0,2 

o 

II 

H i + H A = 1,9 

[""/« = 6 

f t - 0,2 

f 4 = 0,2 

FJn = 0,6 

FJn + FJn = 1,9 

h 2 = 0,20 

n = 80 

«, = 16 



[/,/» - 0,20 

n = 80 

/* = i 6 ] 

1 

1 


m = 6 

w, + n A = 15 

+ 

J 5 

II 

K) 

(Vi 

II 

(VI 

O 

n+n= 20 

r * 

( m = 6 

/ 2 + /4=> 5 

X + /. = 2 5 

N= 50 

/ 5 + / 6 = 20 


7. Determine si las siguientes caracteristicas son cualitativas o cuantitativas. En el caso de ser 
cuantitativas, determine si son discretas o continuas. 

a) Almacenes de la localidad de acuerdo a la especialidad (ropa, zapatos, etc.). 

b) La cantidad de articulos para el hogar comprado en el mes, por 30 hogares. 

c) El numero de unidades por marca, comprado por las amas de casa en un barrio de la ciudad. 

d) Ocupacion de los familiares y amigos. 

e) Pagos mensuales en servicios por los propietarios en un conjunto residencial. 

f) La marca de microcomputadora personal que usan los companeros de la universidad. 

g) La cantidad de tiempo que utilizan por semana los companeros de la universidad en la 
microcomputadora personal. 

8. Que entiende usted por: 

a) Distribucion de frecuencias b) Variable discreta 
c) Frecuencia absoluta d) Frecuencia relativa 

9. Una encuesta realizada a 30 fumadores para determinar el numero de cigarrillos que encienden 
(fuman) en un dia corriente arrojo los siguientes resultados: 

375 10 8458 10 88453 10 57 10 855 12 844358 12 10 

Con los datos anteriores elabore una tabla de frecuencias. 

10. Elabore una distribucion de frecuencias para atributos; tome para ello cualquier caracteristica que 
vea en el salon o en el instituto. 
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11. Diga si son ciertas o no las siguientes afirmaciones. ^Por que? 

a. El mimero de accidentes de trabajo por dias de la semana es un ejemplo de variable discreta. 

b. La suma de las frecuencias absolutas acumuladas, debe ser el doble al valor del tamano de la 
muestra. 


c. 

H s = 0,8 

* 4 = 0,2 

Hr 

0,3 

A 5 =0,3 


!" F J" =0,8 

fi = 0,2 

Fjn = 

0,3 

F r 0,31 


12. Con los datos siguientes, elaborar una tabla de frecuencias sabiendo que la distribucion es simetrica. 


m = 7 

c — 10 

n i 

= 8 

«2 + ", 

= 62 

II 

1*^1 

a 

1.260 

h r 

0,21 

H b = 0,96 

r m = 7 

L 

/ = 10 

f, 

= 8 

ft + fi '' 

= 62 

X,/,- 

1.260 

fjn = 

0,21 

Fjn = 0,96 n 
6 j 

Las estaturas (en centimetros) de 

los socios 

; de un 

club juvenil de Panama, 

son las 

siguientes: 

153 

123 

129 

132 

147 

138 

137 

134 

131 

147 


138 

128 

134 

148 

125 

139 

146 

145 

148 

135 


152 

128 

146 

143 

138 

138 

122 

146 

137 

151 


145 

124 

132 

138 

144 

141 

137 

146 

138 

146 


152 

136 

160 

159 

157 

150 

160 

142 

148 

130 



Se pide agrupar los datos en una tabla de frecuencias con 6 intervalos. 


14. Los siguientes datos corresponden a la distribucion de frecuencias de los gastos en publicidad 
(millones de pesos) de 50 empresas comerciales, durante el ultimo trimestre de 2011. Dichos gastos 
se agruparon en cuatro clases de amplitud constante, de la cual se sabe: 


y,=3,5 

2^ 

ll 

00 

Cj 

n = 4 

A^ 2 = 20 

n } = 25 


!a =3 « 5 

A^=8,75 

1 1 

1^ 1 

1 ll 1 

K-l 

1 1 

F 2 =20 

25 

1 

J 


Se pide elaborar una tabla de frecuencias. 


15. Una empresa dedicada a la produccion de ambientadores en forma de atomizadores, realiza una 

investigacion entre amas de casa del barrio El Recuerdo de esta ciudad, para lo cual selecciona 50 
de ellas, en cuanto al tiempo de permanencia del aroma en su casa, con los siguientes resultados: 
3 horas, 3 amas; 4 horas, 7 amas; 5 horas, 10 amas; 6 horas, 16 amas; 7 horas, 9 amas; 8 horas, 5 
amas. 

a) ^Cual es la poblacion? 

b) /,Cual es la muestra? 

c) ^Cual es la caracteristica? 

d) Diga si la caracteristica es cualitativa o cuantitativa. 

e) Diga si la variable es discreta o continua. 

16. En una empresa, se hace un estudio sobre el mimero de horas que el personal deja de laborar durante 
la semana. Los resultados son: 10 horas, 3 obreros; 3 horas, 7 obreros; 9 horas, 1 obrero; 4 horas, 2 
obreros; 8 horas, 5 obreros; 5 horas, 8 obreros; 6 horas, 6 obreros. 

a) ^Cual es la poblacion? 

b) ^Cual es la variable? 

















CAPITULO DOS 

DISTRIBUCIONES DE FRECUENCIAS 


57 


c) ^Que clase de variable es? 

d) ^Cuantos valores toma la variable? 

e) ^Cuales son los valores de: 


Vi 

n 2 

h 5 

h 4 

r 


F J n f J< 


17. Con los siguientes datos, correspondientes a los saldos (miles de $) de cuentas pendientes: 


11 

70 

65 

62 

53 

78 

41 

48 

74 

63 

34 

38 

69 


79 

76 

55 

59 

69 

78 

75 

34 

68 

56 

61 

41 

83 


54 

49 

68 

48 

64 

84 

74 

68 

73 

69 

31 

69 

78 

64 


Elabore una tabla de frecuencias, calculando m, mediante la formula: m = 1 + 3,3 log n 
Determine los valores de: 

y 3 y 5 h 4 n s c 

" *7 7 7 ' 


18. Con los siguientes datos: 


<N 

<N 

II 

y;= 50 

C = constante 

m = 6 


n = 150 

n i= n 6 

n 2 = n 5 = n t + 5 

n 3 = n 4 = 30 


*2 = 22 

x;=50 

i = constante 

m = 6 


n = 150 

1_ 

f. = f. 

f 2 = f 5 = f 1 + 5 

f 3 =f 4 = 30 



Elaborar una tabla de frecuencias. 


19. Segun la regia de Stages m = 1+3,3 log n ^Cuantas marcas de clase calcularia usted cuando: 

a) n = 50 

b ) n = 200 

c) n = 1.000 

d) La amplitud del intervalo es la diferencia que hay entre el limite superior e inferior de cada 
intervalo. 

20. <^Que opinion le merece a usted, si elaboramos una tabla de frecuencias y utilizamos: 

a) Dos marcas o numero de clases 

b) 28 marcas de clase 

c) 12 marcas de clase 

21. Contestar si son ciertos o falsos los siguientes puntos: 

a) Las frecuencias absolutas son valores que admiten fracciones 

b) La suma de las frecuencias relativas puede ser mayor a 1 

c) Se dice que 0 > h x > 1 

d) El ultimo termino de la frecuencia absoluta acumulada es igual a n. 

22. Decir si son ciertas o no las siguientes relaciones: 

a) m = 6 h x = 0,2 h 4 = 0,2 

b) H 4 = 0,20 H 5 = 0,12 h 5 = - 0,08 

c) m = 4 H+h=H , 

7 5 6 6 


H 2 = 0,6 


H 3 + H 4 = 1,9 
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23. Con el ejercicio 18 ^Que porcentaje de los valores: 

a) Son superiores a 42? 

b) Inferiores a 34? 

c) Entre 18 y 50? 

RECOMENDACIONES EN LA ELABORACION DE CUADROS O 
TABLAS PARA INFORMES 

Las anteriores tablas de frecuencias nos permiten desarrollar con mas facilidad la aplicacion de mediddS 
de posicion, dispersion, asimetria y apuntamiento, nociones basicas en la estadistica descriptiva, sin 
embargo en los informes puede haber cambios en la forma de presentacion de los datos. 

Aunque no se pueden fijar normas rigidas en la presentacion de los cuadros de informes, si es posi- 
ble hacer algunas recomendaciones. 


■ Todo cuadro debe estar numerado, en especial, cuando el informe presenta dos o 
mas cuadros. 

■ El titulo debe indicar: ^que?, ^como?, ^donde? y ^cuando?. 

■ El cuadro consta de un encabezamiento, en el cual van los titulos que deben escribirse 
en mayusculas y los subtitulos con minusculas. 

■ En el cuerpo del cuadro va la informacion. 

■ En un cuadro, ninguna casilla debe quedar en bianco, siendo necesario emplear 
simbolos. 

■ El pie, se ubica abajo de la linea inferior del cuadro y se coloca en el, la fuente, nota 
o llamada que se crean necesarias. 

■ Por presentacion, el cuadro no debe estar cerrado a los lados, sin embargo no se 
hace. 

■ El cuadro debera estar cerrado en la parte superior e inferior con lineas mas 
gruesas. 

■ Se repetira el titulo del cuadro en todas las paginas por el ocupadas, utilizando la 
palabra continua, continuacion o conclusion, segun el caso. 

■ El cuadro podra tener subtotales y totales 


Cuadro N° 

Encabezamiento 

Cuerpo 

Veamos ahora, las clases y la estructura que se debe tener en cuenta en la elaboracion de cuadros o 
tablas de informe. 


Titulo 


MAYUSCULAS 

MAYUSCULAS 

MAYUSCULAS 

minusculas 

minusculas 

minusculas 







Pie 
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Los cuadros estadisticos pueden ser clasificados como: 

S Homogeneos 
Heterogeneos 

( Complejos 

S Corriente 

Correlacion 

La presentacion de las informaciones obtenidas en encuestas, se puede realizar de varias formas, ya 
sean aisladas o combinadas, manteniendo el siguiente orden: 

a) Textual, 

b) Cuadros o tablas, 

c) Graficas. 

a) La presentacion en texto 0 textual, tiene aplicacion bastante limitada; se le utiliza principalmente 
para informes de empresas, articulos, reportajes y otras publicaciones de igual naturaleza. En este 
caso, los datos aparecen intercalados con los comentarios o la simple interpretacion de ellos. 
b) Los cuadros o tablas corresponden a arreglos sistematicos de los datos en filas o columnas. Los 
cuadros son un buen complemento del texto en los informes. 


ELABORACION DE GRAFICAS 


Hemos visto que la estadistica descriptiva cumple con algunas funciones, ya sea suministrando tecni- 
cas para recolectar, ordenar, clasificar mediante cuadros o tablas, de las informaciones obtenidas como 
las que acabamos de ver, pero por si solas no es suficiente, de ahi la necesidad de complementarlas por 
medio de graficas , que nos permitan ver con mayor ligereza la informacion que se ha querido presentar 
mediante cuadros. 

A continuacion en terminos generates, se dan algunas recomendaciones para la elaboracion de 
graficas. 

■ La mejor grafica es la mas simple. 

■ Las graficas deben ser tan sencillas y claras, de tal manera que sean comprensibles sin la 
ayuda de las descripciones del texto. 

■ Las graficas deben seguir y nunca preceder a la exposicion del texto. 

■ Las graficas no sustituyen al cuadro, al contrario deben complementarse. 

■ Las graficas mas comunes se elaboran teniendo como base los ejes de coordenadas 
cartesianas. 

■ La finalidad de las graficas es visualizar mejor la informacion. 

■ La grafica es considerada como el medio de expresion de la estadistica, mas llamativa 
y sugestiva, a la vez que presenta la ventaja de dejar en la memoria una expresion mas 
duradera que los cuadros o el texto, en un menor tiempo de lectura. 

■ Si el informe tiene dos o mas graficas deberan numerarse. 
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■ Toda grafica debe tener titulo que indique con claridad el contenido de la misma. Las 
lineas y simbolos usados, deben ser los estrictamente indispensables. 

■ Las lmeas que representan los datos o las variables, deben ser mas gruesas que las 
escalas. 

■ La linea vertical (ordenada) representa las frecuencias, y se debe comenzar de cero. 

■ Las caracteristicas cualitativas y cuantitativas, por lo general, van en la linea horizontal 
(abscisa). 

■ La lectura de la escala del eje horizontal se hace de izquierda a derecha. La del eje vertical 
debe hacerse de abajo hacia arriba. 

■ Cuando la grafica presenta mas de una caracteristica o variable, debera diferenciarse por 
medio de leyendas, notas o signos convencionales. 

■ En toda grafica se debe explicar la fuente de donde fueron obtenidos los datos; 
ademas aclarar las escalas, leyendas, notas y convenciones que ayuden a identificar las 
caracteristicas presentadas. 

Hemos dividido las graficas en dos grandes grupos: aquellas que generalmente se utilizan para el 
desarrollo de la teoria estadistica, tales como los diagramas de frecuencias y de dispersion , los histogra- 
mas, poligonos y ojivas. El segundo grupo lo conforman las graficas que frecuentemente vemos en las 
publicaciones, llamense informes, periodicos, revistas, publicidad, etc., como son las graficas: circula- 
res, de barras, de lmeas , pictogramas, cartogramas y muchas mas. 

GRAFICAS APLICADAS AL DESARROLLO DE LA TEORIA ESTADISTICA 

Diagramas de frecuencias. Son muy utilizados para representar las frecuencias absolutas y relativas, 
incluyendo las acumuladas que ocurren con respecto a una variable aleatoria discreta. Se representan por 
lineas delgadas ya sean verticales u horizontales, colocando las frecuencias. 

Ejemplo 1. Con los datos de la tabla 2.1 elaboraremos los respectivos diagramas de frecuencias. 



Diagrama de frecuencias 
absolutas 


Diagrama de frecuencias 
absolutas acumuladas 



i - 



30 - 


0 


2 3 4 

No. de hijos 


2 3 

No. de hijos 


0 


1 


4 
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Histograma. Son diagramas de frecuencias unidimensionales, en los cuales se levantan rectangulos de 
areas, proporcionales a las frecuencias de clases sobre los intervalos del eje horizontal, por lo tanto es 
utilizado para representar a la variable continua, cuando la amplitud es constante. 

La representacion grafica, para las frecuencias relativas y absolutas en variables continuas, se hace me- 
diante histogramas de frecuencias. En el eje de las abscisas se senalan los intervalos que constituyen la 
base del rectangulo, y en el eje vertical u ordenada corresponde a las frecuencias absolutas o numero 
proporcional de ellas, formando la altura del rectangulo (Figura No. 2.2). Sin embargo, en la confeccion 
de este grafico se pueden presentar grupos irregulares o sea, cuando la amplitud es diferente para cada 
intervalo, presentando unos espacios pequenos y otros demasiados grandes. Este grafico aparentemente 
correcto (Figura No. 2.3), es en realidad falso y enganoso. Para obtener un grafico correcto es preciso 
dividir la frecuencia absoluta, por la amplitud del intervalo, es decir: 

Altura = —— 1 (Ver figura 2.4 y tabla 2.10) 


El histograma de frecuencias se representa por medio de rectangulo o areas: 


Tabla 2.8 


Tabla de frecuencias 


tii -y’i 

n. 

i 

h 

i 

N. 

i 

H 

i 

46,1-54 

3 

0,10 

3 

0,10 

54,1-62 

6 

0,20 

9 

0,30 

62,1-70 

8 

0,27 

17 

0,57 

70,1-78 

6 

0,20 

23 

0,77 

78,1-86 

4 

0,13 

27 

0,90 

86,1-94 

3 

0,10 

30 

1,00 

2 

30 

- 

1,00 

- 


f, 

f i/n 

F; 

FJn 


Figura 2.2 


Histograma de frecuencias 



Tabla 2.9 


Obreros clasificados por edades en una 
grafica 


EDAD 

(ANOS) 

No. 

OBREROS 

16,1-25 

55 

25,1 -28 

47 

28,1 -31 

32 

31,1-40 

26 

E 

160 


Figura 2.3 


Histograma elaborado incorrecto 
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Tabla 2.10 


Figura 2.4 


Obreros clasificados por edades en una grafica 


Histograma correcto 



AMPLITUD 

FRECUENCIAS 

ALTURA 

C. 

n. 

ft/C. 

9 

55 

6,11 

3 

47 

15,66 

3 

32 

10,66 

9 

26 

2,88 

/ 

f, 

f/i 


Figura 2.5 


Ojiva 



Figura 2.6 


Ojiva. La representation grafica para las frecuencias 
absolutas y relativas acumuladas en una variable con- 
tinua se hace a traves de una ojiva ascendente. Para 
ello se determinan los puntos de interseccion entre 
cada valor de la variable y su respectiva frecuencia; 
luego se unen con trazos rectilineos. (Figura No 2.5). 
Practicamente es un poligono de frecuencias, con la 
diferencia de ser aplicado a una tabla de frecuencias 
absolutas acumuladas. 

Poligono de frecuencias. En la variable continua 
es bastante utilizado este diagrama, fijando puntos, 
utilizando las marcas de clase y las frecuencias, 
luego se unen dando una linea quebrada. Si en el 
histograma de frecuencias unimos los puntos me- 
dios en la parte superior de cada rectangulo, obte- 
nemos el poligono de frecuencias (figura No. 2.6 
y 2.7). 


Figura 2.7 


Poligono de frecuencias Poligono e Histograma 




yU —y\ 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 

24. Responda a los siguientes puntos, diciendo si son ciertas o falsas las siguientes afirmaciones: 

a) A1 hacer una grafica, la variable a estudiar va en el eje de las abscisas y las frecuencias en la 
ordenada. 

b) El poligono de frecuencias se emplea para representar a la variable continua. 

c) Entre mas caracteristicas tenga la grafica, se le considera como la mejor. 

d) Si los intervalos no son iguales, nos facilita la elaboracion del histograma por lo tanto sera mucho 
mas representativo. 

25. Con los datos del ejercicio No. 9 construya los diagramas de frecuencias tanto con las frecuencias 
absolutas, como con las acumuladas. 

26. Con los datos del ejercicio No. 13, se pide elaborar el histograma de frecuencias. 

27. Con los datos del ejercicio No. 15, se pide graficar el conjunto de observaciones. 

28. Con los datos del ejercicio No. 18, se pide elaborar el histograma de frecuencias. 

29. Elaborar un histograma y poligono utilizando la siguiente distribucion: 



y ,'-1 -/ 

40,1-52 

4,1 -20 

20,1-24 

24,1-32 

32,1 -40 


Vi -L 

”, 

30 

16 

20 

10 

24 

100 



30. Explique brevemente que entiende usted por: 

a) Marcas de clase 

c) Intervalo de clase 

e) Poligonos de frecuencias 


b) Variable continua 
d) Histograma de frecuencias 
f) Amplitud del intervalo. 


31. En una investigacion realizada a 800 empresas sobre valor de las ventas, en una quincena, se 
obtuvo la siguiente distribucion. 


VENTAS 

PORCENTAJE 
DE EMPRESAS 

8-18 

0,30 

18 - 48 

0,25 

48 - 98 

0.18 

98 - 148 

0,14 

148 -200 

0,13 


Se pide: 

a) Completar la distribucion de frecuencias 

b) Cuantas empresas venden menos de 98 mill $ 

c) Elaborar el histograma y poligono de frecuencias. 


32. Los ingresos semanales (miles de $) de 50 trabajadores de la construccion fueron los siguientes: 
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170 

172 

183 

164 

166 

164 

160 

168 

173 

176 

184 

190 

163 

151 

158 

166 

166 

172 

170 

186 

170 

166 

169 

160 

158 

155 

160 

157 

163 

165 

170 

172 

178 

183 

170 

166 

165 

172 

168 

158 

158 

168 

166 

159 

154 

166 

172 

168 

163 

172 


a) Se pide elaborar una tabla de frecuencias. 

b) Construir un histograma, el poligono y la ojiva. 

33. Con los siguientes datos sin agrupar, correspondientes a saldos (en miles de pesos) de cuentas 
pendientes: 


77 

70 

65 

62 

53 

78 

41 

48 

74 

63 

34 

38 

69 

64 

79 

76 

55 

59 

69 

78 

75 

34 

68 

56 

61 

41 

83 

54 

49 

68 

48 

64 

84 

74 

68 

73 

69 

31 

69 

78 


Elaborar una tabla de frecuencias y dibujar la ojiva. 


APLICACIONES DE LA FUNCION EXCEL EN LA 
r ELABORACION DE TABLAS O CUADROS 



Acudimos a la informa- 
cion que aparece en la 
tabla No. 1 (ver SIL: 
Aplicaciones estadisti- 
cas en Excel). Para 
elaborar nuestra tabla, 
seleccionamos otras 
celdas donde aparezcan 
los datos ya organizados, 
por ejemplo, ubicamos 
el cursor desde M6 hasta 
Ml5, tecleamos el titulo 
CLASE y a continuacion 
(debajo) en orden 
ascen-dente se teclean 
los valores que toma 
nuestra variable, siendo 
01234568 como lo 
podemos observar en la 
aplicacion siguiente: 


Figura No. 1. Ubicacion de Datos 
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Guiandonos por la Tabla No. 1 del SIL, realizamos la seleccion de la informacion que 
encontramos en esta tabla y la llevamos a una hoja de Excel. 

Hacemos clic en ANALISIS DE DATOS en el grupo ANALISIS de la ficha DATOS. Si el 
comando ANALISIS DE DATOS no esta disponible, debemos hacer CLIC en el boton y 
en OPCIONES EN EXCEL seleccionamos COMPLEMENTOS y damos CLIC en IR. A 
continuacion, aparece un cuadro de dialogo en el que activamos la opcion HERRAMIENTAS 
PARA ANALISIS y finalmente hacemos CLIC en ACEPTAR. El proceso anterior nos permite 
ver el icono ANALISIS DE DATOS en la tabla de calculo, tal como se presenta a continuacion: 
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TABLA No. 1 POBLACION (1.100 ESTUDIANTES DE UN CENTRO EDUCATIVO) 
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Con base en la cuarta columna denominada “Numero de hermanos”, ubicada en la celda D, que aparece 
en la Tabla No.l del ejemplo que seguimos, realizamos el HISTOGRAMA. Nos aparece un cuadro de 
dialogo denominado HISTOGRAMA, el cual diligenciamos tal como se especifica a continuacion: 

□ En el RANGO DE ENTRADA seleccionamos el rango correspondiente a D3:D52 

□ Con el cursor nos ubicamos en el RANGO DE CLASES, que lo hemos establecido como 
M7:M14 (ver figura No. 1) 

□ Nos situamos en la casilla RANGO DE SALIDA y la activamos haciendo CLIC en el circulo 
que se antepone. Tecleamos en esta casilla la celda en la cual queremos que se presenten 
los resultados, en nuestro caso seleccionamos la celda N17, columna que presentara las 
distribuciones de frecuencias correspondientes. 

□ Si ademas del cuadro nos interesa crear el grafico, EXCEL lo realiza como HISTOGRAMA, 
cuando en realidad es un grafico de BARRAS. Para obtener la representacion grafica, se debe 
seleccionar la opcion CREAR GRAFICO. 

□ Finalmente hacemos CLIC en ACEPTAR. 


Figura No. 4. Datos de Histograma. 
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Una vez hecho el CLIC en ACEPTAR; obtenemos en pantalla los resultados esperados, es decir, se 
tendra el cuadro de frecuencias con sus respectivos valores de clases, desde N17 hasta N27, a su lado 
debe aparecer la grafica por haberse seleccionado la opcion CREAR GRAFICO. 

A continuacion se presentan los resultados, en el cual aparece laTABLADE FRECUENCIAS acompanada 
de un HISTOGRAMA similar a la GRAFICA DE BARRAS. 
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FiguraNo. 5. Resultados Histograma. 
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Luego de finalizado el procedimiento anterior, se procede a trasladar la figura a un procesador de 
texto para efectos de presentacion. 


Grafica 1. Histograma 



Nota: 

(1) La linea que puede aparecer en este tipo de grafico, correspondera a un DIAGRAMA DE 
FRECUENCIAS PORCENTUALES, cuando senalamos o hacemos CLIC en PORCENTAJE 
ACUMULADO. 
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(2) Observe que Excel incluye una ultima clase como mayor por si existen valores superiores. 
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(3) Como se puede observar, en vez de HISTOGRAMA, aparece una grafica de barras. Se recomienda 
hacer el histograma en forma correcta utilizando la funcion graficas de barras, al principio aparecen 
barras separadas y utilizando area SERIES ofrece dos altemativas (FILAS) (COLUMNAS) con una 
de ellas toma la forma adecuada. 

GRAFICAS UTILIZADAS EN LA PRESENTACION DE INFORMES 

Los graficos, son utilizados con el fin de visualizar mejor la informacion, no sustituyen al CUADRO, 
antes por el contrario lo complementan. Algunos lo consideran como algo decorativo del informe, pero 
esto no es cierto, ya que ayuda a mostrar la informacion mucho mas rapida y agradable, que la obtenida 
a traves del TEXTO o del mismo CUADRO. 

El EXCEL es una buena herramienta para la elaboracion de GRAFICOS, ofreciendonos variadas 
formas de presentacion, tales como: 


COLUMNAS; BARRAS; LINEAL; CIRCULAR; DISPERSION;AREAS; 
ANILLOS RADIAL; SUPERFICIE; BURBUJAS; COTIZACIONES 


De las anteriores opciones, las primeras cuatro (4) son las mas utilizadas, las que a su vez son muy 
sencillas, para visualizar mejor la informacion. 

Ejemplo 1. Para indicar el proceso que se sigue en la elaboracion de una GRAFICA consideramos 
como informacion (cualitativa) la matricula de 5.100 alumnos, distribuidos por facultades, en una insti- 
tucion universitaria de la capital. 


Cuadro 2.1. Alumnos matriculados por facultad en el instituto X 
(primer semestre de 2011) 


FACULTAD 

NUMERO DE ALUMNOS 

% 

Administracion 

800 

15,69 

Contaduria 

600 

11,76 

Derecho 

1.200 

23,53 

Economia 

700 

13,73 

Ingenieria 

1.300 

25,49 

Psicologia 

500 

9,80 

Total 

5.100 

100,00 


□ Digitamos la anterior informacion en una hoja de calculo EXCEL, recomendando aumentar el 
ancho de las columnas (la primera) a fin de lograr una mejor presentacion. 

□ Activamos las CELDAS que contienen la informacion o datos que deseamos graficar, incluidos 
los TITULOS y ROTULOS. En este caso consideramos las columnas: Facultades y Numero 
de alumnos. 

□ Procedemos a hacer CLIC sobre la pestana del grupo GRAFICOS en la ficha INSERTAR. 
Una forma mas rapida consiste en seleccionar directamente sobre el grupo GRAFICOS el que 
mas se adapte segun el tipo de informacion que tengamos 
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Figura No. 6. Insertar Grafico. 
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□ Los datos pueden estar organizados en FILAS o COLUMNAS. Debemos tener en cuenta el 
rango de datos que vayamos a seleccionar; en este caso, seleccionamos el rango de A2:B8. 

□ Seleccionamos el TIPO DE GRAFICO que deseemos crear, haciendo CLIC en el. En nuestro 
caso consideramos el grafico de COLUMNAS, optando por uno de los DISENOS de las 
diecinueve (19) posibilidades que se presentan. 

□ Despues de crear un grafico, es posible modificar cualquiera de sus elementos en la ficha 
HERRAMIENTAS DE GRAFICO, de acuerdo a las pestanas de DISENO, PRESENTACION 
y FORMATO. De este modo, podemos cambiar la forma en que se presentan los ejes, el titulo 
del grafico, mover u ocultar la leyenda asi como incluir elementos de grafico adicionales. Esto 
nos permite AGREGAR o QUITAR aquello que deseamos que aparezca o desaparezca. 

□ El grafico se puede ver de dos formas, como objeto y como una hoja nueva. 

□ Como una HOJA NUEVA: Mostrando el grafico en la misma hoja, denominada HOJA 
DE GRAFICO, hacemos CLIC sobre el grafico ya insertado y en la pestana de DISENO, 
encontramos el fichero UBICACION; Hacemos CLIC en MOVER GRAFICO y elegimos la 
opcion HOJA NUEVA. 

□ Como OBJETO, seguimos el procedimiento anterior solo que esta vez elegimos la opcion 
OBJETO EN, especificando la hoja en la que deseamos insertar el grafico. En este caso el 
grafico no genera una hoja nueva sino un cambio de ubicacion, por ejemplo de hoja 1 a hoja 2. 
Lo anterior se presenta en la figura siguiente: 
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Figura No. 7. Grafico de Columnas 
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Figura No. 8. Opciones de pegado de Grafico 
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□ Finalmente, mejoramos la presentacion del grafico, haciendo CLIC en el area del grafico, le 
damos opcion COPIAR, y luego lo pegamos donde quiera que estemos realizando el informe o 
trabajo tal como se presenta a continuacion: 
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GRAFICO CIRCULAR O PASTEL 

El uso de este grafico CIRCULAR, se hace muy conveniente cuando la(s) caracteristica(s) que se quieren 
visualizar son ATRIBUTOS o CUALITATIVOS, tal como en el ejercicio que se realizo anteriormente al 
aplicar la grafica de BARRAS, para lo cual consideramos la matricula de 5100 alumnos en una institucion 
universitaria de la capital. 

Vale la pena tener en cuenta que este tipo de grafico no es muy indicado en aquellos casos donde la 
caracteristica presenta numerosos aspectos, igual como en el ejercicio que nos ocupa, si la institucion tu- 
viera mas de 10 facultades, esto haria un grafico muy recargado y no se lograria una buena visualizacion 
de la informacion. El proceso que se sigue en la graficacion es muy similar al de las barras. Veamoslo: 

□ Tomamos la misma informacion para la grafica de barra. 

□ Activamos las CELDAS respectivas, incluyendo los TITULOS, en este caso FACULTADES y 
NUMERO DE ALUMNOS. 

□ Nos ubicamos en la ficha INSERTAR haciendo CLIC en la pestana GRAFICOS para cambiar 
el tipo de grafico. 

□ Seleccionamos CIRCULAR y uno de los SUBTIPO DE GRAFICO. En nuestro ejemplo, 
optamos por el primero de las seis (6) opciones que nos ofrece y hacemos CLIC en ACEPTAR 

□ De ahi en adelante seguimos los pasos similares a los mostrados en el GRAFICO DE BARRAS, 
de acuerdo con la siguiente presentacion, tal como se puede observar en las aplicaciones que 
aparecen a continuacion: 
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Figura No. 9. Insertar Grafico. 
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□ Seleccionando la opcion HOJA NUEVA, nos resulta la siguiente GRAFICA en una hoja 
completa. 


Figura No. 10. Resultados de Salida 
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□ Si tecleamos la opcion de ETIQUETA DE DATOS, es posible mostrar la distribucion que 
presentan las diferentes categorias. Esto es, nos indica la cantidad de ALUMNOS que hay por 
cada facultad. 

□ Finalmente, se puntea la grafica y se pega en el informe o tarea que se este realizando. 


Figura No. 12. Grafico Circular en una Hoja Nueva. 
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Grafico No. 3. Grafico Circular. 


ALUMNOS MATR1CULADOS 
POR FACULTAD 


,0% 16% 



m Adrninistracion 
h Derecho 
Li Filosofia 
■ Econorrria 
u Sicologfa 
h Pedagogia 


GRAFICO DE LINEAS 

Son de gran aplicacion en las denominadas SERIES DE TIEMPO O SERIES CRONOLOGICAS, donde 
una de las variables corresponde al TIEMPO (X) (anos, meses, dias, etc.) y la segunda la variable 
investigada (Y), en nuestro caso PRODUCCION (ciento mill $) y/o COSTO (ciento mill $). Recordemos 
que en el eje horizontal 0 abscisa van los valores correspondientes a la variable tiempo y en el eje 
vertical u ordenada los valores de la variable (Y) produccion y/o COStO. 


Cuadro 2.2 Produccion y Costo (ciento mill $) en la empresa X 


ANOS 

PRODUCCION 
(ciento mill $) 

COSTO 
(ciento mill $) 

2004 

260 

110 

2005 

380 

200 

2006 

300 

150 

2007 

620 

420 

2008 

470 

360 

2009 

720 

510 

2010 

870 

620 


□ Una vez construida la tabla en una hoja electronica EXCEL, se deben activar las celdas 
correspondientes a PRODUCCION y COSTOS, al momento de hacer la selection de los datos 
de grafico. 

□ En la ficha INSERTAR hacemos CLIC en el grupo Graficos y seleccionamos el tipo de grafica 
LINEAS. 

□ Activamos el subtipo de grafico cuatro (4) de las siete (7) opciones que nos muestran. 
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FiguraNo. 13. Insertar Grafico. 
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Figura No. 14. Resultados de Salida 
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En la opcion ETIQUETAS DEL E JE HORIZONTAL que se encuentra dentro del cuadro SELECCIONAR 
ORIGEN DE DATOS, elegimos la opcion EDITAR y seleccionamos el rango de datos correspondiente 
alosANOS. 


Figura No. 15. Seleccion Origen de Datos. 
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Figura No. 16. Seleccion Anos de la produccion y costo de la Empresa X. (Pantalla Adic.) 
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FiguraNo. 17. Titulo del Grafico. (Pantallazo Adicional). 
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□ Finalmente, agregamos el titulo y hacemos los ajustes de diseno que consideremos pertinentes. 


Figura No. 18. Resultados Grafica de Lineas. 
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□ Luego de este paso se selecciona el grafico, y se copia en el informe o tarea que se este 
realizando. 




















































































































78 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


Grafica 3. Grafica de Lineas. 
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□ Con los datos utilizados en el cuadro No. 2.2 (ver pagina 97), seleccionamos las variables 
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□ En el cuadro de dialogo INSERTAR GRAFICO que nos aparece, seleccionamos la opcion XY 
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posibles. 


FiguraNo. 19. Insertar Grafico. 


de grafico como plantilla filasy columnas datos rapido ^ 

U ' ' ' '•I grafico 1 


Tipo Datos Disenos de grafico 

Estilos de disefio 

Ubicacion 


A2 - (- jEr | 


- 

1 

A B CD 

ACTIVIDAD ECONOMICA EMPRESA X 

Seleccionar origen de datos 



Rango de datos del grafico: j 


- 1 [ r?] Cambiar fila/columna ] 





► PRODUCCION (mil 1$) 
■ COSTO (mill $) 


< ► ►' Hojal , Hoja2 Hoja3 


H < 1 i 

► A 

Senalar j 


|HOH ioo% 


y AP 101 - Paint 

| LJ Libro Est 

| (W) APLICACIONES EN.,. 

ES 11:14 







































































































CAPITULO DOS 

DISTRIBUCIONES DE FRECUENCIAS 


□ De los datos de origen se obtienen los siguientes resultados: 


Figura No.20. Salida de Resultados. 
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□ Ahora procedemos a colocar el titulo del grafico y el de los ejes, como se puede observar en la 
aplicacion siguiente: 


Figura No. 21. Insercion Titulo del Grafico y de los Ejes. 
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□ Microsoft Excel - L... 
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Grafica No. 4. Grafico de Dispersion XY 
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c) Simples 


d) Compuestos 
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Pictogramas 



Numero de entidades Cooperativas creadas segun linea de actividad 
de julio 1° de 2006 a 30 junio de 2011 



Ahorro Comer- Consu- Edu- Produc- Tra- Trans- Vivien- 

y credito ciali- mo ca- cion ba- por- da 

zacion cion j o te 

LINEA DE ACTIVIDAD 



Cartogramas 
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Graficas semilogaritmicas 

Estas graficas se emplean en casos concretos, cuando se requiere destacar las variaciones relativas mas 
que las absolutas; tradicionalmente utilizamos la escdld aritmetica espaciando los valores de la escala 
vertical (ordenada) en proporcion a las diferencias absolutas; en cambio en la escdld logaritmica los 
espacios corresponden proporcionalmente a las diferencias logaritmicas, siendo menores estos espacios. 
Consideremos la representacion de un determinado indice para un periodo, siendo inicialmente de 400 
y al finalizar el periodo, de 460; el incremento en valor absoluto es de 60; pero si tenemos otro indice 
que representa otra variable con la cual estamos comparando para el mismo periodo, iniciando con 
800 y finalizando en 920, podemos observar que el incremento es de 120, es decir el doble del anterior, 
pero porcentualmente el incremento en ambos casos es igual, es decir, del 1 %. Estos dos indicadores 
representados graficamente en una escala aritmetica (valor absoluto) muestran la variation, en cambio 
en la logaritmica representan la misma magnitud siendo esta ultima la que concuerda con la realidad. Es 
necesario anotar en la grafica, que solamente la escala vertical es de tipo logaritmico y la horizontal es 
aritmetica. 

Para la confection de un grafico semilogaritmico se requiere desarrollar los siguientes pasos: 


a) Se debe establecer el valor maximo y minimo que tomara la escala vertical, en este 
caso hacemos referencia al indice (no hay problema, si los valores tornados en la escala 
son ligeramente superiores e inferiores a los extremos obtenidos en la information a 
representar). 

b) Se calcula la diferencia de los logaritmos de los valores maximo y minimo obtenidos en el 
paso anterior. 

c) Se establece cuantos centimetros tendra la escala del grafico correspondiente. 

d) Se divide el valor dado en centimetros, establecido en el punto c, por el resultado obtenido 
en el punto b, es decir, (c/ b). 

e) Multiplicamos el logaritmo correspondiente al valor maximo dado en la escala, en el punto 
a, por el resultado obtenido en el punto d y se le resta el valor del punto c. 

f) Luego, para cada valor (en nuestro caso el indice) de la tabla se obtiene su respectivo 
logaritmo y se le multiplica por el valor del punto d y se le resta el valor obtenido en el 
punto. 

g) Los valores resultantes son dados en centimetros y corresponden a la ordenada por cada 
valor que tome la abscisa (eje horizontal). 


Graficas logaritmicas 

El grafico logaritmico, se emplea cuando las dos variables muestran un crecimiento geometrico, por 
lo tanto en ambos ejes (ordenada y abscisa) se utilizara la escala logaritmica y sirve para comparar los 
cambios relativos de una variable, conforme a los cambios relativos de otra variable. Esta representacion 
es muy usual en economia cuando se trabaja con oferta y demanda, precios relativos y cantidades, bien 
sea de oferta o de demanda; en estos dos ejemplos, estamos comparando los valores relativos de una con 
respecto a valores relativos de otra. 
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Se dice, que si las dos variables relacionadas presentan un crecimiento geometrico se debera utilizar 
el papel logaritmico, pero si una de ellas presenta un crecimiento aritmetico mientras que la otra variable 
lo hace en forma geometrica se empleara el papel semilogaritmo, con lo cual se logra una representation 
grafica correcta. 

Graficas Gantt 

Tienen como fin presentar las tareas o etapas de un proceso, relacionandolas con el tiempo de su ejecu¬ 
cion, de gran interes en el planeamiento o actividad empresarial, siendo su aplicacion tan amplia y de 
tanto exito que puede ser desarrollada en una empresa que tenga 2 6 3 obreros, como en aquellos estable- 
cimientos comerciales o industriales de gran magnitud. 


□ Los elementos que conlleva a la elaboration del grafico Gantt es tan sencillo, que es 
facil de comprenderlo, representando a la vez el espacio, tiempo y la tarea a ejecutar. 
Podriamos clasificar estos graficos en tres formas: 

□ Los que tratan de resaltar la relation existente entre lo realizado y lo que podria haberse 
hecho, tal es el caso de un obrero o maquina al realizar una determinada labor, podriamos 
estar determinando el tiempo inactivo. 

□ Cuando se desea establecer un reparto equitativo de la tarea con el fin de evitar la 
inactividad (obrero o maquina) y de esta manera lograr su ejecucion segun el orden 
establecido de antemano. 

□ Para comparar de una manera continua la ejecucion de una tarea de acuerdo al plan 
trazado con anterioridad y dar a conocer las causas que han impedido su cumplimiento. 


Graficas de volumen 

Constantemente observamos en los diferentes medios de comunicacion (periodicos, revistas, T.V.) la uti¬ 
lization de graficas de volumenes y pictogramas, en estos ultimos, como ya lo vimos se emplean figuras 
tales como personas, animales, fabricas, aviones, casas, etc., debiendo en ambos casos ser proporcionales 
a las cantidades para que sean representativos. 

Veamos un pequeno ejemplo en el cual se quieren representar los gastos de una pequena empresa, 
tomando tres aspectos: salarios, publicidad y alquiler, utilizando cubos. En este caso si se conoce o se 
establece la longitud de un lado (arista), se podra calcular el volumen siendo 3 3 , supongamos que la 
arista para el cubo que representa los salarios es de 4 cms., se tendra que el volumen es 4 3 = 64 cm 3 , 
que representa a un gasto en salarios de 40 millones de pesos; ahora bien, si el gasto en publicidad es de 
8 millones de pesos se tendra que 40/8 = 5 veces mas pequeno proporcionalmente y su volumen sera 
64/5 = 12,4 cm 3 ; finalmente consideramos alquileres por un valor de $5 millones siendo 40/5 = 8 veces 
mas pequeno y su volumen sera 64/8 = 8 cm 3 . De acuerdo a los resultados anteriores la arista para cada 
caso sera igual: 


Salarios = -J~64 = 4c ms. 

Publicidad : 

iJ\2A = 2,31 cms. 

Alquileres = ^8 = 2,20 cms. 










84 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


Graficas enganosas 

Con frecuencia se presentan graficas enganosas al falsear una de las escalas, veamos estas dos 
representaciones graficas lineales presentadas en forma desfavorable, casi con fluctuaciones suaves 
tratando de disimular las bajas subitas. 


Grafica A I Grafica B 




Anos 


Anos 


Grafica C 



2005 2006 2007 2008 2009 2010 2011 


Se puede observar en la GRAFICA B, como al 
omitirse el ultimo ano hay cambio total con 
respecto a la anterior, desaparece la recuperacion 
que ofrece la variable para el ano 2011, dejando 
la sensacion de que la tendencia de esa serie es 
a la baja. En ambos casos las escalas estan mal 
trazadas y las graficas mal presentadas. 

Veamos ahora otras situaciones que se po- 
drian presentar con los mismos datos, distorsio- 
nando totalmente la informacion que se desea 
presentar en forma clara y objetiva. La grafica C 
es la forma correcta de presentacion de la serie. 


Anos 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 

34. Contestar verdadero si el enunciado es veridico. Si no lo es, la palabra en negrilla debe sustituirse 

por una expresion con la cual el enunciado sea valido. 

a) Un cuadro o tabla es la mejor forma de visualizar la informacion. 

b) El recuento de los empleados en una empresa, de acuerdo al cargo, es un ejemplo de variable 
discreta. 

c) El pictograma es la representacion estadistica por medio de mapas, dentro de los cuales se ubican 
simbolos. 

d) El histograma es un tipo de representacion en grafica de rectangulos de una distribucion 
continua. 

e) El grosor de la lamina de metal que la compania A utiliza en sus procesos de manufactura es un 
ejemplo de atributos. 

f) La poblacion o universo es un subconjunto de unidades extraidas al azar en tal forma que nos 
permita tener informacion sobre un grupo mayor. 

35. El costo estimado, en miles de pesos ($) por kilometro, para la operacion de un automovil (Renault, 

Mazda, Chevrolet) modelo 2002, se muestra en la siguiente tabla: 


Construya una grafica circular y otra de barras 

36. ^Que ventajas tienen las graficas en un resumen de datos? 

37. Represente los siguientes datos en millones de $ en ventas: 


ANOS 

2006 

2007 

2008 

2009 

2010 

2011 

y, 

2.000 

1.800 

4.600 

1.200 

4.600 

8.230 


38. Representar los siguientes datos en millones de $, en costos y ventas: 


ANOS 

2007 

2008 

2009 

2010 

2011 

y, 

120 

180 

75 

240 

200 

X. 

150 

170 

100 

200 

250 


39. Opinion de los electores sobre si van a votar para Congreso y Presidente en las proximas elecciones. 
Se pide elaborar el grafico correspondiente: 


OPINION 

CONGRESO % 

PRESIDENTE % 

Afirmativo 

22,24 

48,32 

Negativo 

77,76 

51,68 

Total 

100,00 

100,00 


Seguros 

$1060 

Parqueadero 

38 

Impuestos 

37 


Depreciation 

$236 

Mantenimiento 

212 

Gasolina 

85 


































86 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


40. Elabore la grafica correspondiente. 


ANOS 

2007 

2008 

2009 

2010 

2011 

Produccion (miles ton.) 

380 

450 

700 

740 

720 

Ventas (miles ton.) 

260 

350 

600 

520 

508 


41. Con los siguientes datos presentados en una tabla de frecuencias: 


Se pide elaborar: 

a) Un histograma 

b) Un poligono de frecuencias 


42. Suponga que los precios de 5 articulos para dos periodos han sido: 


ARTICULOS 

2010 

2011 

YARIACION % 
2010 - 2011 

Vehiculos (usados) 

$12,500,000 

$11,300,000 

-9,60 

Computadores 

1.700.000 

1.100.000 

-35,29 

Betamax 

250.000 

350.000 

40,00 

Celular 

1.200.000 

1.500.000 

25,00 

Antenas parabolicas 

300.000 

410.000 

36,67 


Elaborar una grafica de barras en dos direcciones (positivo y negativo) o en dos sentidos: 


43. El consejo de administracion de una gran cooperativa de vivienda desea investigar la posibilidad de 
contratar un supervisor para el parque de juegos infantiles. Se hizo una encuesta en la totalidad de 
las 616 familias de la cooperativa y cada familia tuvo un solo voto, cualquiera que fuera el tamano 
del apartamento. Los resultados fueron: 

/,Debe la cooperativa contratar un supervisor? 


Convierta los datos en porcentajes y construya: 

a) Una grafica de barras 

b) Una grafica circular 

c) Una grafica de componentes de porcentajes 


44. Los siguientes datos corresponden al tiempo (minutos) que han necesitado 30 clientes de un Banco 
para llevar a cabo una transaccion bancaria. 


Si 

146 

No 

91 

No esta seguro 

158 

No Respondio 

221 


y\-x-y-t 

n i 

4,1-24 

36 

24,1-32 

20 

32,1-36 

18 

36,1 -48 

22 

48,1-52 

14 

I 

110 


20 

42 

62 

32 

28 

20 

38 

26 

30 

18 

42 

54 

16 

32 

42 

36 

18 

56 

41 

16 

14 

42 

34 

14 

24 

51 

49 

24 

18 

56 
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Se pide elaborar: 

a) Una tabla de frecuencias 

b) Histograma y el poligono en una sola grafica. 

45. Una empresa petrolera “Compama X” en su informe anual menciono las siguientes ventas netas y 
el costo de ventas desde 2006 (en miles de millones de pesos). 


VARIABLE 

2006 

2007 

2008 

2009 

2010 

2011 

Ventas netas 

Costo de ventas 

19.116 

15.776 

15.586 

12.895 

13.534 

18.287 

21.344 

18.476 

27.342 

20.698 

30.620 

25.382 


Se pide: 

a) Elaborar un cuadro que represente esta informacion para ser publicada en una revista de la 
facultad. 

b) Haga como minimo dos graficas que permitan representar la informacion anterior. 

46. Con los siguientes datos correspondientes a una variable discreta, dibujar el diagrama de frecuencias, 
tanto para frecuencias absolutas como acumuladas. 



2 

4 

6 

8 

10 

12 

i 

7 

15 

8 

10 

16 

4 


47. Un almacen al cierre de sus ventas encuentra que el porcentaje de ellas por articulo se distribuye asi: 
42% camisas; 8% corbatas; 34% pantalones; 5% calcetines; 11% otros articulos. Se pide elaborar: 

a) Un grafico de barras 

b) Una grafica circular. 

48. Los siguientes datos corresponden al numero de retardos (en la manana) por parte de los empleados 
de una empresa, durante el mes: 


2 

5 

0 

0 

6 

3 

5 

0 

0 

2 

7 

4 

4 

2 

3 

8 

4 

3 

3 

1 

3 

2 

3 

2 

4 

2 

2 

3 

1 

3 

2 

0 

0 

1 

4 

2 

2 

0 

3 

5 


Se pide elaborar una tabla de frecuencias y los diagramas correspondientes. 


49. Las calificaciones de 30 alumnos que presentaron examen de admision a la facultad, utilizando una 
escala de 0 a 100, fueron: 


83 

64 

51 

46 

82 

91 

73 

65 

82 

61 

74 

64 

75 

81 

94 

65 

42 

81 

56 

61 

72 

65 

39 

54 

70 

93 

42 

46 

54 

72 


Elaborar un cuadro de frecuencias y dibujar los graficos correspondientes (histograma, poligono y 
ojiva). 

50. Una oficina de publicidad fue contratada con el fin de presentar en una revista de ventas, la 
distribucion porcentual de ventas (valor) por jornadas (manana, tarde, noche), realizada por 4 
grandes almacenes de la capital, cuyos resultados fueron: 
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ALMACENES 

MANANA (9 -1) 

TARDE (1 - 5) 

NOCHE (5 -10) 

Carulla 

22,5 

42,6 

34,9 

Carrefour 

38,6 

45,4 

16,0 

Exito 

30,3 

36,8 

32,9 

Vivero 

46,4 

32,8 

20,8 


Con la informacion del cuadro adjunto, se pide elaborar dos (2) graficas, con el fin de seleccionar 
una, para que aparezca en la revista ^Cuales elaboraria usted? 

51. Con los siguientes datos (miles mill $), el gerente de una compania, le propone hacer dos graficos, 
con el fin de escoger uno de ellos. ^Cuales haria usted? 


ANOS 

2007 

2008 

2009 

2010 

2011 

Ventas 

260 

350 

600 

520 

510 

Produccion 

380 

450 

700 

740 

630 


52. Una investigacion realizada a 120 estudiantes en un instituto universitario requiere elaborar una 
grafica. 


DEPORTES 

Ajedrez 

Baloncesto 

Balompie 

Natacion 

Ciclismo 

Tenis 

ALUMNOS 

13 

47 

62 

34 

20 

8 


53. Dibuja un histograma y al poligono de frecuencias, partiendo de la siguiente informacion obtenida 
de una tabla de frecuencias. 



53 

II 

Os 

ft, = 0,10 

H 2 = 0,25 

y 3 

= 60 

H j + H a = 0,95 




ft, = 2 (ft,) 

ft 4 - 0,20 


= 4 

c = 10 


m — 6 

i 

1 

|| 

1 11 

1 ■£ 

r 

FJn= 0,25 


= 60 

FJn+FJn = 0,95 

1 


JJn=2{j\ln)_ _ 

fj«= 0,20 


= 4 

i = 10 

1 

_ 

Smtesis de cai 

ii'tulo 







Da la sensacion en numerosos informes, que el objetivo final es la presentacion de 
CUddros o tables, para mostrar lo dispendioso que ha sido al proceso de recoleccion 
y la abundancia de resultados obtenidos, sin preocuparse por lo que ellos digan. El 
procesamiento de la informacion es una de las etapas importantes en la elaboracion de 
estadisticas, pues mediante ellas organizamos, relacionamos y en parte describimos 
el comportamiento de un conjunto de datos. 

Un cuadro por si solo, no es explicativo, su elaboracion se constituye en un 
instrumento que se emplea como complemento del texto explicativo; sin embargo 
esto no basta, pues a su vez debe estar acompanado de una buena grafica. Esta 
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ultima tiene la gran ventaja de visualizar mejor la information pero nunca sustituye 
al Ciiadro , ni al texto. 

La grafted por fallas en confection, generalmente por desconocimiento de las 
tecnicas necesarias para una buena representation, se convierte en una herramienta 
que a menudo se utiliza para enganar incautos, produciendo graficas aparentemente 
llamativas pero desorientadoras. 

En este capitulo vimos unas graficas generalmente utilizadas para explicar la 
teoria estadistica, ellas son: los diagramas en la variable discreta; los histogramas, 
poll go nos y ojivas en la variable continua. Otras graficas, tales como las circulares, 
pictogramas, barras, cartogramas , etc., que se empleanenlos informes y que son las 
que frecuentemente observamos en los diarios o revistas que presentan estadisticas. 







Medidas de posicion 
y de tendencia 
central 


Los sabios son los que buscan sabiduria: 
los necios piensan ya haberla encontrado. 

Napoleon Bonaparte 



■ Terminos, definiciones, conceptos 
generales. 

■ Finalidad, usos, aplicaciones, venta- 
jas y desventajas de cada uno 

■ Promedios: Media, Mediana, Moda, 
Media geometrica, Armonica, Cua- 
dratica y Cubica. 



Cuartiles, Deciles y Percentiles. 
Centro recorrido 


Sintesis de la Unidad. 

Ejercicios para Resolver, resue 

en el Sistema de Informacion en 
Linea SIL. 


COMPETENCIAS 



El estudiante debera estar en capacidad de: 



□ Conocer, manejar y aplicar en cada caso 
particular el respectivo promedio. 


□ Entender el uso, las ventajas y desventajas 
que ofrece ese promedio. 


□ Saber aprovechar las propiedades que 
ellas tienen. 
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ASPECTOS GENERALES 


En el capitulo anterior, se dijo que la estadistica cumplia una funcion descriptiva haciendolo mediante 
cuadros y graficas, ahora lo complementamos con la aplicacion de una serie de medidas de posicidn y de 
dispersion , que nos permiten la descripcion de un hecho o de un conjunto de observaciones. 

Las medidas de posicidn o de tendencia central, denominadas tambien como promedios , nos per¬ 
miten determinar la posicion de un valor respecto a un conjunto de datos, el cual lo consideramos como 
representativo o tipico, para el total de las observaciones. 

Estas medidas aplicadas a las caracteristicas de las unidades en una muestra, se les denomina esti- 
madores o estadigrafos. En cambio, aplicadas a las caracteristicas de los elementos de una poblacion, se 
les conoce como parametros o valores estadisticos de la poblacion. 

Si con el resultado obtenido, en una encuesta aplicada en una zona o barrio de la ciudad, afirmamos 
que el consumo promedio de leche por familia es de dos litros por semana, estamos representando una 
gama o variedad de consumos, que van desde familias que no consumen, hasta un consumo superior a 
dos litros. Con esta informacion hacemos referencia al comportamiento del consumo de leche en una 
zona de la ciudad; tambien, el resultado puede ser comparado con los consumos promedios de otros 
barrios, o el consumo promedio por persona, o establecer la relacion que puede haber entre el consumo 
y los niveles de ingresos. 

Dependiendo de la naturaleza de los datos, la misma necesidad que se tiene y/o la caracteristica que 
ellos representan, requieren de la aplicacion de un promedio especial dentro de los diferentes tipos que 
se expondran a continuacion, pero para ello deberan tenerse en cuenta algunas reglas que seran basicas 
en la seleccion de estas herramientas de descripcion. 

CARACTERISTICAS, USO, VENTAJAS Y DESVENTAJAS DE LAS MEDIDAS DE 
TENDENCIA CENTRAL Y DE POSICION. 

Un promedio es un valor en la escala de las X correspondiente a una distribucion de frecuencias, cuyo 
valor se calcula para representarla en calidad de medida tipica del grupo. 


Algunas condiciones esenciales para que este valor pueda cumplir su cometido: 

■ Debe estar representada por una sola cifra. 

■ Debe ser objetiva y definida por una formula algebraica, de tal manera que cualquiera 
que sea la persona que trabaje con la distribucion, se obtenga siempre el mismo 
valor. 

■ Debe ser descriptiva de los datos, de manera que su significado sea facil de entender. 

■ No debe ser una abstraccion matematica, que unicamente pueda ser entendida 
por personas muy versadas en esta ciencia, ya que una de las condiciones de la 
estadistica, es simplificar los datos y no hacerlos mas complejos. 

■ Debe ser facil de calcular, pero esta condicion no debe preferirse en perjuicio de 
otras ventajas. 

■ Debe depender de cada uno de los elementos del grupo, de tal manera que si se 
altera alguno de estos, consecuentemente se altera el valor del promedio ya que 
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por definicion, esta es representante tipica de todos los miembros del grupo y no 
solamente del alguno de ellos. 

■ A pesar de que cada uno de los valores de los elementos del grupo debe tener 
influencia en el valor de la medida, esta debe ser de tal calidad que no se deje afectar 
demasiado por alguno o algunos pocos valores. 

■ Debe tener lo que los estadisticos llaman estabilidad en el muestreo. 

■ Debe ser de uso facil para calculos matematicos posteriores. 


El pro medio es un termino muy utilizado por todos, aunque indeterminado. Se dice generalmente 
que un valor promedio, intenta representar o resumir las caracteristicas de un conjunto de valores. La 
expresion corriente de promedio, suele en la mayoria de los casos referirse a la medid aritmetica. 

MEDIA ARITMETICA: X=]i 

Es la medida de posicion o promedio mas conocida, la mas utilizada y entendida por todos, por su gran 
estabilidad es la preferida en el muestreo, sus formulas admiten tratamiento algebraico. Su desventaja 
principal, es ser muy sensible a cambios en sus valores u observaciones, tambien, cuando alguno de sus 
valores extremos es demasiado grande o pequeno 


Ventajas 

■ El promedio aritmetico es, en si, la medida mas entendida y la mas utilizada. 
Es un valor tal, que si se calculara para un grupo en el cual todos los elementos 
fueran iguales, cada uno de ellos seria igual a su promedio aritmetico, por lo cual 
podemos deducir que el promedio de n elementos, es un nuevo elemento formado, 
correspondiernte a una parte igual a 1 In de cada uno de los elementos originales. 

■ Esta medida se define mediante una ecuacion matematica muy facil de entender y 
algunas veces se puede obtener cuando no es posible calcular otros tipos de medidas 
de tendencia central o de posicion y, aun en el casos de no conocerse los valores 
individuales de la serie, por ejemplo: si 10 familias consumen 20 litros de leche, el 
promedio aritmetico sera de 2 litros por familia. 

■ El promedio aritmetico es extraordinariamente estable en el muestreo. 

■ Es altamente sensible a cualquier cambio en los datos de la distribucion. 

■ Como ventaja final, se podra anotar que es excepcionalmente adaptable cuando se 
trata de hacer calculos matematicos posteriores con el. 

Des ventajas 

■ Es muy sensible a valores muy pequenos o grandes, especialmente cuando estos 
ultimos se encuentren incluidos en la distribucion que se esta estudiando, puede 
resultar en un promedio que no represente lo tipico para el total del grupo. 

■ Cuando la distribucion es marcadamente asimetrica, de tal forma que el promedio 
aritmetico , la mediana y el modo difieran en forma apreciable, debe considerarse 
siempre la posibilidad de que el promedio aritmetico pueda no ser el valor unico 
representativo de la serie. 
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■ Otro inconveniente o desventaja, es cuando la distribucion tiene la forma de U, es 
decir, parabolica; este corresponde a los valores menos comunes en la serie y por 
tanto, puede darnos una idea irreal de la distribucion. 


Esta medida, por lo general, se representa mediante una equis con una raya o trazo colocado en su 
parte superior, sin embargo se utilizan otros simbolos como se pueden observar a continuacion. 


a 

d y 

a x 

M 

M 

M 

[y] 

X 

y 

M 

[*] 

A 


Se define como la “suma de todos los valores observados, divididos por el numero 
total de observaciones ” De esta forma definida, solo se aplica en datos sin agrupar, 
tambien denominados como datos originales. 


Media aritmetica simple 

Se trabaja con datos sin agrupar u originales, siendo: 



n 


Donde 



(Minusculas en las muestras) 


ju = X = 


M. 

N 


; Siendo 




x 1 + x 2 +x 3 .X,, 

N 


(Mayusculas y letras griegas en la poblacion) 


Ejemplo 1. Aplicando la formula dada para calcular la media aritmetica, en datos no agrupados, de 
acuerdo a los datos del Ejemplo 1, de la Unidad 2, correspondiente a una muestra realizada en 30 cajas, 
para determinar el numero de unidades con piezas defectuosas, se tendra que: 



3+2+0+ 

x =- 

30 


+ 2 


— = 2,23 Aproximadamente 2 unidades defectuosas por caja 


Ejemplo 2. Apliquemos la anterior formula para datos no agrupados con los datos dados, en el caso de 
una variable continua (Ejemplo 2 de la Unidad 2), correspondiente a una muestra de 30 alumnos, con la 
cual se quiere investigar su peso promedio. El resultado es. 



x = 


74 + 67 + 94 + 
30 


+ 92 


2.067 

30 


= 68,9 


Media aritmetica ponderada. 

Se aplica en datos agrupados, es decir, aquellos que se encuentran organizados enuna tabla de frecuencias, 
siendo las frecuencias absolutas sus ponderaciones.. 

Ejemplo 3. Supongamos que dispone de informacion para 10 Observaciones: 8, 2, 8, 6, 2, 2, 6, 8, 2, 4. 
La media aritmetica sera: 


_ 8 + 2 + 8 +.+ 4 

x =- 


48 Ahora si calculamos la media aritmetica de las mismas 10 obser- 

_ A y 

10 ~ ’ vaciones, pero ordenadas, el resultado obtenido sera el mismo. 


10 
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Ejemplo 4. En el ejemplo de las 30 cajas, seleccionadas con el fin de establecer el promedio de unidades 
defectuosas por caja, se podra obtener tambien aplicando la formula de calculo para datos agrupados, 
como se observa a continuation: 


y t 

n i 

y, n , 

0 

4 

0 

i 

5 

5 

2 

7 

14 

3 

8 

24 

4 

6 

24 

I 

30 

67 

Xi 

fi 

Xfi 


Con la infonnacion de la tabla 2.1- Unidad 2 

La Media aritmetica trabajando con datos agmpados sera: 


y = 


Zy.n, 


- SAT./. 

X = —^ 
N 


y = — — = — = 2,23 Unidades defectuosas 
n 30 


Ejemplo 5. Algo similar lo podemos hacer, para el calculo de la media aritmetica en la variable continua. 
Se obtiene en primer lugar las marcas de clase y luego se trabaja exactamente, como se hizo en la variable 
discreta. 


yu-y’i 

", 

yt 

y, n i 

46,1-54 

3 

50 

150 

54,1-62 

6 

58 

348 

62,1-70 

8 

66 

528 

70,1-78 

6 

74 

444 

78,1-86 

4 

82 

328 

86,1-94 

3 

90 

270 

I 

30 

- 

2.068 

Ti-i-x’i 

f 

X 

Xfi 





5^2068 

n 30 


Calculo de la Media, utilizando Frecuencias Relativas 

Esta medida tambien se puede calcular, utilizando como ponderaciones a las frecuencias relativas, con 
las cuales se obtendra el mismo resultado: 
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- 2 y t n , 

y — 


y,n, + +....+ v ?? 

— _ -11 -22 _ J - m n 


Se sabe que h t - — por lo taiito se tiene que 
n 


y=y,K + y 2 h 2 + . y m K 


y = 

6 


\ x =^ x ,{fii n ) 


Ejemplo 6. Considerando las tablas de frecuencias (2.1 y 2.4) calculamos las medias aritmeticas, en 
cada una de ellas, trabajando con las frecuencias relativas, cuyos resultados deberian ser iguales, pero en 
algunos casos se observan algunas diferencias, debido a la aproximacion a dos digitos, que se hizo para 
las frecuencias relativas. 


y , 

A ( 

M 

0 

0,13 

0 

1 

0,17 

0,17 

2 

0,23 

0,46 

3 

0,27 

0,81 

4 

0^20 

0,80 

£ 

1,00 

2,24 


fi 

x fi ) 


y=^A=2,2y 

( 2 . 2 ) 

V - Yy i h i = 68,88 


y , 

h i 

j’A 

50 

0,10 

5.00 

58 

03 ) 

11.60 

66 

0,27 

17,82 

74 

0 ^) 

14,80 

82 

0.13 

10.66 

90 

0,10 

9,00 

s 

1,00 

68,88 

Xi 

Jf 



DESVIACIONES 


Se considera necesario mencionar las Desviaciones con respecto a la media aritmetica , las cuales 
se definen como las diferencias que hay entre los distintos valores que toman la variable y la media 
aritmetica, tanto en datOS sin agrupar como en datOS agrupados , por lo general simbolizada por Z ; o d. 


iZ, = x. 


• x i 

_ _ j 


(En datos sin agrupar) 


^ =y t -y 


(Para datos agmpados 


Ejemplo 7. Procedamos a considerar una nueva fuente de informacion con 8 datos, sin agrupar: 6, 10, 4, 
10, 8, 2, 6, 2. En primer lugar calculamos la media y luego sus desviaciones. 


x 



n 



z 1 =x 1 -x = 6-6=0 <^> [ d _i\ 
z 2 = x 2 -x = 10-6= 4 <=> i d 2 1 
z, = x,-x= 4-6=-2 <=> A 

D J i_i 


Ejemplo 8. Si calculamos las desviaciones con respecto a la media, en una tabla con datos correspondiente 
a una variable discreta (2.1) en la cual la media fue de 2,23, se tendra: 


y t 

n i 

y-y 

0 

4 

-2,23 

i 

5 

-1,23 

2 

7 

-0,23 

3 

8 

0,77 

4 

6 

1,77 

I 

30 

- 

X, 

ft 



= y\ ~y = 0 - 2,23 =-2,23 
z 2 = y 2 -y = 1-2,23 =-1,23 
z 3 = y 2 -y = 2 - 2,23 =-0,23 
z 4 = y 4 -y = 3 - 2,23 = 0,77 
z 5 = y 5 -y =4-2,23 = 1,77 


l d, =x, -x l 
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Ejemplo 9. Para el calculo de estas desviaciones en la variable continua, se debe trabajar con las marcas 
de clase. La media aritmetica de los datos de la tabla 2.2 fue de 68,93. 


z 1= ^-7=50-68,93 = -18,93 
z 2 = y 2 -y- 58-68,93 =-10,93 
z 3 = y 3 -y= 66-68,93 =- 2,93 
z 4 = y^ — y =74 — 68,93 =+ 5,07 
z 5 = y 5 -y =82-68,93 =+13,07 
z 6 = y 6 - y =90-68,93 =+21,07 


PROPIEDADES DE LA MEDIA ARITMETICA 

Se hace necesario conocer y manejar correctamente las propiedades que presenta la Media aritmetica, 
pues facilita la realizacion de ciertas operaciones, algunas de ellas necesarias para el desarrollo de la 
teoria estadistica y otras, como simplificacion de calculos. 

a) La suma de las desviaciones respecto a la media, siempre seran iguales a cero. 

i--1 

6 |_E dj = :A7_- X\ = 0 _| En datos sin agmpar 

\ -__- 1 

6 | ytjfi = X)f ± = 0_] En datos agrupados 


EZ, = EU -X) = 0 
EZ « = E(v, - y)n t 


yu - y\ 

y 

y-y 

46,1-54 

50 

-18,93 

54,1-62 

58 

-10,93 

62,1-70 

66 

-2,93 

70,1-78 

74 

5,07 

78,1-86 

82 

13,07 

86,1-94 

90 

21,07 

I 

-- 

- 

xu -X\ 

Xi 

Xi -X 


Aplicacion 


y, 

n t 

y-y 

(y,-y)n, 

0 

4 

-2,23 

-8,92 

1 

5 

-1,23 

-6,15 

2 

7 

-0,23 

-1,61 

3 

8 

0,77 

6,16 

4 

6 

1,77 

10,62 

E 

30 

- 

0 

X, 

f, 

x-x 

(x-x)f, 


EZ.«. = E(j’, - y)n i = 0 


n 


67 


30 


Nota: Si sumamos los valores de la ultima columna de la tabla, 
deberia haber dado cero, pero resulta que nos da 0,10, en vez 
de 0, ello se debe que el valor de la media es 2,23333 que usted 
puede comprobarlo trabajando con todos estos decimales. 


b) La media aritmetica de una variable por una constante, es igual a la constante por ia media 
aritmetica de la variable. 


Aplicacion 


y, 

n i 

yPi 

0 

4 

0 

1 

5 

5 

2 

7 

14 

3 

8 

24 

4 

6 

24 

E 

30 

67 

Xt 

f 

Xifi 


_ Ev,«: 67 

v - " ' - - 2.23 

n 30 

K = 4 

268 _ 
n 30 

y, 

n i 

y, n , 

0 

4 

8 

12 

16 

4 

5 

7 

8 

6 

0 

20 

56 

96 

96 

y = ky= 4(2,23) =8,92 

E 

30 

268 

Por las aproximaciones en la media inicial. 

x- 

fi 

Xifi 
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La variable de la primera tabla, esta dada en Kilos, y en la segunda tabla convertida en libras y se desea 

calcular la media aritmetica en libras. r -- 

i - EX f i 

i x = - — i 

1 N 1 

i_ — _i 

c) La media aritmetica de una constante es igual a la constante \^>m (k) =K\ . Supongamos queun 
estudiante durante el semestre le hicieron 6 evaluaciones y en cada una de ellas la calificacion 
obtenida fue 4, su promedio sera exactamente cuatro (4) 

__ Ex. _ 4 + 4+4+ 4 + 4 + 4 _ 24 
n 6 6 

(Propiedad vista en la sumatoria) 

d) La media aritmetica de una variable mas una constante , es igual a la media aritmetica de la 
variable. Esta propiedad de la suma, es valida para la diferencia 

Aplicacion 


Yk nk 
n n 


y, 

n , 

y, n , 

0 

4 

0 

l 

5 

5 

2 

7 

14 

3 

S 

24 

4 

6 

24 

s 

30 

67 


f, x,f, 


n 30 

K = 4 

gW = 187 , 

« 30 

y, 

y t n, 

4 

5 

6 

7 

8 

4 

5 

1 

8 

6 

16 

25 

42 

56 

48 

y=y + k = 2,23+4 = 6,23 

i 

30 187 

Por las aproximaciones en la media inicial. 

~Xt 

fi X,fi 


M [*+*] = *+k M [x _ k] =x-k 


e) La media aritmetica de la suma de dos variables , es igual a la suma de las dos medias 
correspondiente a las dos variables. Algo similar sucede con la diferencia o cuando se toma 
mas de dos de dos variables. 

M [x + y] =M [x] +M [y] = * +)> M [x-y ] = M [x] ~ M [y] = * ~ ? 


f) La media aritmetica de dos muestras, es igual , a la media ponderada de lassubmuestras , siendo 
sus ponderaciones los tamanos de esas submuestras. 


Aplicacion 


Muestra 


y 

n 

i 

M n i 

50 

3 

150 

58 

6 

348 

66 

8 

528 

74 

6 

444 

82 

4 

328 

90 

3 

270 

i 

30 

2.068 

Xi 

f 

xJi 


Submuestra 1 


y, 

n 

i 

X”, 

50 

3 

150 

58 

6 

348 

66 

8 

528 

I 

17 

1.026 

X, 

f 

xj 


Submuestra 2 


y. 

n 

i 

y, n i 

74 

6 

444 

82 

4 

328 

90 

3 

270 

z 

13 

1.942 

X, 

f 

xd 
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Muestra 


Submuestra 1 


Submuestra 2 


n = 30; j = =68,93; 

30 


_ 1.026 

n, = 17; X, = -= 60,35; 

1 1 17 


1 042 

n, =13; x, = LHZ± =8 o,15 
2 1 13 


x,«, + x 2 n 2 + 
«, +n 2 + .... 


^ _ 60,35(17)+ 80,15(13) 
17 + 13 


1.026 + 1.042 
30 


2.068 

30 


= 68,93 


EJERCICIOS PARA RESOLVER 



La gran mayorla de los ejercicios de este libro, se encuentran resueltos en Sistema de Information 
en Lrnea SIL. 


1. Con los siguientes datos referentes a una distribucion simetrica, se pide calcular la media 
aritmetica aplicando uno de los metodos que usted conoce. 


r 

■ x ' 

yr- 

10 

20 

30 

40 

5 


1 

n r 

6 

10 

18 

10 

6 

= 50 


2. Con los siguientes datos 


153 

123 

129 

132 

147 

138 

137 

134 

131 

147 

158 

128 

134 

148 

125 

139 

146 

145 

148 

135 

152 

128 

146 

143 

138 

138 

122 

146 

137 

151 

145 

124 

132 

138 

144 

141 

137 

146 

138 

146 

152 

136 

160 

159 

157 

150 

160 

142 

148 

130 



Se pide: 

a) Calcular la media aritmetica para datos no agmpados u originales. 

b) Elaborar una tabla de frecuencias. 

c) Calcular la media aritmetica para datos agmpados, primero utilizando las frecuencias absolutas 
y luego las relativas. 

d) Comprobar que la suma de las desviaciones con respecto a la media es cero. 

3. Con la tabla anterior, se pide: 

a) Dividir la tabla en dos, cada una con tres intervalos y calcular la media para cada una. Luego con 
esas medias aplicar una de sus propiedades, para calcular una sola media. 

b) Utilizando la tabla completa, multiplique por dos a la variable, calculando la nueva Media; luego 
aplique la propiedad para abreviar el procedimiento. ^Cual? 

4. Con la siguiente distribucion de frecuencias, calcular la media ponderada. 


yi-i - y; 

6,1-12 12,1-18 

18,1-24 

24,1-30 

30,1-36 

36,1-42 


U-1 -r t 



8 12 

40 

70 

90 

100 



j 


5. Si la media de 75 articulos es 52,6 galones y, la de 25 articulos es de 48,4 galones, en- 
cuentre la media de los 100 articulos. 

6. De 500 estudiantes de secundaria, cuya estatura media es de 1,57 metros, 150 de ellos son 
mujeres. Si la estatura media de las mujeres es de 1,52 metros ^Cual es la estatura media 
de los varones? 
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7. Un grupo de 200 estudiantes, cuya estatura media es de 160,96 centimetros, se dividen en dos 
grupos, uno con una estura media de 163,4 centimetros y otro con 157,3 centimetros. ^Cuantos 
estudiantes hay en cada grupo? 

8. Se realiza una prueba a dos secciones de un curso de matematicas, con un promedio general de 
60,98. La seccion I tiene una media de 57,30 y la seccion II de 65,30. Si hay 27 estudiantes en la 
seccion I.^Cuantos hay en la seccion II? 

9. En una competencia atletica con 45 participates, 20 compiten el primer dia y los restates al 
dia siguiente. Si en el primer dia, los 20 obtienen un promedio de 48,4 puntos. ^Cual es el menor 
numero de puntos que deben obtener en promedio los restates atletas, de modo que el puntaje 
medio de todo el equipo sea por lo menos igual a 55,0? 

10. Un grupo de 100 atletas viaja en dos aviones. El primero lleva 40 atletas y el segundo los restates. Se 
sabe que el peso medio de todos los atletas es de 186,3 libras y que el de los del segundo avion es tres 
libras menos que el de los atletas del primer avion ^Cual es el peso medio de los atletas en cada avion? 

11. En un examen tornado a tres secciones en un curso de estadistica de 91 alumnos, el puntaje medio 
general fue de 69,3. Los puntajes medios de las secciones 1 y 2 fueron 70,4 y 64,2 respectivamente. 
Se perdieron los archivos con las notas de la seccion 3, pero los monitores recuerdan que las secciones 
1 y 2 tenian exactamente el mismo numero de alumnos, mientras que el monitor de la seccion 3, 
afirma que su seccion tenia 5 estudiantes menos que la l./,Cual fue el promedio de la seccion 3? 

12. La media aritmetica de los salarios pagados en un mes a los empleados de una empresa, ascendio 
a $920,000. La media aritmetica de los salarios pagados a los hombres y a las mujeres, fueron 
respectivamente $970,000 y $840,000. Determinar el porcentaje de hombres y mujeres empleados 
en dicha empresa?. 

13. El salario medio mensual por obrero en la empresa A fue de $938,000 durante el 2010. Para el 
presente ano la empresa aumento a cada uno de sus empleados la suma $78,000. Admitiendo que 
los salarios no se han modificado desde entonces. /,Cual es el promedio mensual? 

14. En cierto examen el puntaje medio de los estudiantes del curso A es 68,4 y los del B 71,2. Si el 
puntaje medio del grupo es 70,0 ^Cual es la relacion, entre el numero de los alumnos, en los cursos 
Ay B? 

15. En un curso hay 35 hombres con una media de 17,5 anos y 15 mujeres, las que en promedio son 
22% mas jovenes. /,Cual es la edad promedio del curso?. 

16. El precio promedio de un centenar de articulos es $18,750, los articulos se dividen en dos grupos, 
con medias $17,580 y $19,780 ^Cuantos articulos hay en cada grupo? 

17. Se sabe que ninguna de las sucursales de una empresa comercial, tiene mas de 19 empleados o 

menos de 17. La mayoria tiene 18 empleados, pero el 25% tiene 19 empleados y cada una de las 10 
sucursales tiene 17 empleados. ^Cual es el promedio de empleados por sucursal? 

18. De 10 familias investigadas con telefono, auto y antena parabolica, se obtuvo la siguiente informacion, 

en miles de pesos, sobre los gastos mensuales en: 

a) Costo del telefono por familia $56 64 38 60 42 28 55 70 42 y 63 (Miles pesos). 

b) Costo promedio mensual en mantenimiento $83 

c) La distribucion de costos de servicio mensual de la parabolica, es 


COSTOS (Miles de pesos) 

80,1-120 

120,1-160 

160,1-200 

200,1-240 240,1-280 

N° DE FAMILIAS 

1 

3 

2 

3 1 
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Se pide calcular el costo total promedio mensual por familia, de los 3 servicios. 

19. Los siguientes datos corresponden a los salarios mensuales, en miles de pesos, pagados por una 
empresa a su personal. 


SALARIOS (Miles pesos) 

500 

600 

700 

800 

900 

N° EMPLEADOS 

10 

16 

35 

26 

13 


En la empresa se presenta un conflicto laboral. El gerente propone un aumento del 7% mensual, para 
cada uno de los empleados. La Junta directiva propone un aumento de $49,000, para cada empleado. 
Se solicita su asistencia tecnica, para que se discuta que es mas ventajoso para la empresa y que para 
cada grupo de empleados, segun su clasificacion por nivel de salarios. ^Como actuaria usted? 


a) 

h 5 - 

= 0,36 

V 4 = 30 

n 5 =6 

n= 5 

b) 

y, = 

17 

m = 5 

c =6 

y= 125 

c) 

y,n, 

= 240 

y =8 

n = 40 


d) 

H , 

= 1,10 

H 4 = 0,80 

/? 3 = 0,30 



21. Senale y justifique la respuesta correcta a las siguientes afirmaciones: a) El promedio de las notas de 
un curso fue de 5,8. Las 25 mujeres obtuvieron un promedio de 3,8 y los hombres de 6,4. Luego el 
curso tiene mas de 90 alumnos. b) Si H 6 = 0,7 y H 3 = 0,3 un 40% de las observaciones de la variable 
es menor que y 6 y mayor que y 4 c) El ingreso mensual medio de los obreros agricolas es $635,000, 
el de los mineros es $754,000 y el de los industriales es $864,000, es decir, el ingreso medio del 
conjunto de obreros es de $754,000. d) Para calcular la media geometrica, es preciso que todos 
los intervalos sean iguales. e) El 75% de los empleados publicos son hombres, mientras que en el 
sector privado es el 81%. Esto es, hay un 22% de mujeres empleadas en ambos sectores. f) Si se 
multiplica por 2 todas las frecuencias relativas, el valor de la media aritmetica tambien se duplica. 

22. Contestar si es cierto 0 fdlso a los siguientes puntos: a) La suma de las desviaciones es igual a cero, 
cuando se toma con respecto a la media, b) Un grupo de valores puede tener mas de una media 
aritmetica. c) Para calcular las marcas de clase, se suma el limite inferior al superior del intervalo y 
se divide por dos. 

23. Un laboratorio de control de calidad de una empresa, quiere lanzar al mercado un nuevo spray 
ambientador, para determinar el tiempo de permanencia del aroma; los resultados fueron observados 
cada hora, habiendose obtenido:10 horas, 5 apartamentos; 3 horas, 3 apartamentos; 5 horas, 10 
apartamentos; 4 horas, 7 apartamentos; 6 horas, 16 apartamentos; y al final, 8 horas, 9 apartamentos. 
a) Cual es la poblacion? b) Cual es la muestra? c) Cual es la variable d) Que tipo de variable es? 
e) Cual es el promedio de duracion del aroma? f) Elabore una grafica que la represente. 

24 En una empresa constructora de vivienda, los jomales mensuales de los obreros tienen una media 
de $655,000. Como solucion a un conflicto laboral se proponen dos alternativas: a) un aumento del 
8%; b) un aumento del 5%, mas una bonificacion mensual de $25,000 a cada obrero. ^Cual de las 
dos alternativas le conviene aceptar al sindicato, si se quiere que la distribucion de los salarios sea 
lo mejor posible? 

25. El promedio de salario mensual para un grupo de obreros es de $662,000. El gerente de la firma 
resuelve reconocerles un aumento diario por cada obrero de $3,000; si consideramos los meses de 
30 dias. ^Cual sera el nuevo promedio de salario mensual? 
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26. Un almacen de articulos electronicos, se dedica a la venta de cuatro lineas de producto. Se sabe que 
el ano anterior el total de ventas (Millones de $) y margen de utilidad por linea fueron los siguientes: 


LINEA DE PRODUCTOS 

VENTAS 

MARGEN DE UTILIDAD 

1 - Televisores. 

214.000 

12,6 % 

2 - Neveras. 

90.000 

5,8% 

3 - Equipos de sonido.... 

183.000 

9,3% 

4 - Lavadores. 

75.000 

4,6% 

TOTAL. 

562.000 





Se pide calcular: a) La media aritmetica simple del margen de utilidad. b) La media ponderada del 
margen de utilidad. c) /,Cual de las dos medias es mas representativa? ^Por que? 

27. Una firma de produccion multiple, tiene cuatro lineas de productos. Durante el mes de octubre del 
presente ano, los resultados obtenidos al realizar las operaciones de rutina de calidad, fueron las 
siguientes: 


Determinarelpromedio 
porcentual de articulos 
defectuosos producidos 
por dicha firma en el 
mes de octubre del 
presente ano. 


28. Dos fabricas tienen 80 y 120 empleados, respectivamente. El salario promedio mensual para el 
total de empleados es de $620,000. Sabiendo, ademas, que los empleados de la primera de ellas, 
ganan en promedio $58,500 mas que los empleados de la segunda.^Cual es el salario promedio 
mensual de los empleados en cada una de las fabricas? 

29. Un grupo de 400 empleados se divide en operarios y tecnicos, con un salario promedio de $980,600. 
Los salarios promedios para los dos grupos son $725,730 y $1,076,500. ^Cuantos operarios y 
cuantos tecnicos hay? 

30. Tres almacenes tienen un total de 80 vendedores. Los dos primeros pagan mensualmente $925,000 
y $870,000 respectivamente y tienen ademas, el mismo numero de vendedores. Se quiere saber, 
cual es el salario promedio de los vendedores del tercer almacen, si se sabe, que el salario promedio 
de los vendedores de los tres almacenes es $890,000 y ademas, tiene 10 vendedores menos que el 
primer almacen. 


31. 

Un grupo de empleados tienen los siguientes salarios mensuales (Miles de $). 




$ 730 510 640 680 480 640 710 

600 

780 


Los empleados piden un reajuste del 15%, pero el empresario ofrece un aumento del 10%, mas una 
bonificacion mensual de $20,000. /,Cual cree usted que debe ser la decision mas ventajosa para el 
empleado? 


32. Conteste cada una de las siguientes preguntas, investigando. 
a) ^Que significa el termino “promedio”? 


LINEAS DE 
PRODUCCION 

UMDADES 
PRODU CID AS 

PORCENTAJES 

DEFECTUOSOS 

A 

8.300 

0,8 

B 

12.600 

1,1 

C 

24.300 

2,6 

D 

15.800 

1,4 

TOTAL 

61.000 
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b) ^Que ventajas y desventajas tiene la aplicacion de la media aritmetica? 

c) ^Se pondera la media aritmetica? ^Por que o por que no? 

33. Un inversionista compro acciones de varias empresas en la Bolsa de Bogota, asi: 500 acciones a 
$2,500 cada una; 1.200 a $5,800 cada una; 600 a $10,000 c/u y 2.500 a $800 c/u. a) ^Cual es la 
inversion total? b) ^Cual es el precio promedio por accion? 

34. A un profesor de estadistica le asignaron 5 cursos con igual numero de alumnos, al finalizar el 
semestre, los promedios de calificacion de cada curso fueron: 3,6; 4,1; 3,2; 3,8; y 4,6. a) ^Cual es 
la calificacion promedio con ese profesor? b) Ahora suponga, que el numero de alumnos por curso 
fue; 32; 40; 26; 34; y 15 ^Cual es el promedio de calificacion por curso? 


MEDIANA M e 

Es considerada tambien, al igual que la M ec//a, como una medida de tendencia central. Su importancia es 
menor, sus formulas son rigidas ya que no admiten tratamiento algebraico, es por eso que tendremos que 
aplicar seis procedimientos de calculo diferente, que lo hace engorroso, como lo veremos a continuacion: 

Se define como “a quel valor de la variable que super a a no mas de la mi tad de las observaciones, 
al mismo tiempo, es superado por no mas de la mitad de las observaciones " en otras palabras, se puede 
definir como el “valor central”. Se simboliza por M e 


Ventajas 

■ Esta medida tiene una definicion bastante rigida y el concepto de ella es tan claro, 
que cualquier persona lo entiende, aun sin ser familiar su termino. 

■ Los datos deben estar ordenados, pero los valores extremos no tienen ninguna 
incidencia en su calculo. 

■ Tiene menor estabilidad en el muestreo que el promedio aritmetico, pero mayor 
estabilidad que otras medidas. 

■ Hay situaciones en que la unica medida de tendencia central que puede utilizarse 
es la mediana , especialmente cuando los valores extremos de una distribucion de 
variable continua no estan definidos 

Desventajas 

■ No es tan conocida como la media aritmetica. 

■ Se hace necesario ordenar los datos para poderla calcular. 

■ Esta medida no se adapta a calculos posteriores aritmeticos, por cuanto que si 
obtenemos las medianas de diferentes grupos, no se podra calcular una mediana 
para el conjunto. 

■ Tampoco es sensible a cambios en los valores de los elementos, manteniendose el 
valor central y los valores ordenados. 
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Calculo en datos sin agrupar u originates 

a) Numero impar de observaciones. Cuando esta medida la aplicamos en los datos originates o sin 
agrupar, lo primero que se debe hacer, es ordenarlos de menor a mayor o de mayor a menor. 

Ejemplo 1. Supongamos se tienen los siguientes datos: y X ; =2 X 2 =18 X 3 =4 X 4 = 12 Observemos 

que la serie es impar, ya que n = 5 por lo tanto ordenamos los datos, por ejemplo, de menor a mayor: 

La mediana sera igual al valor central M e = 6 

b) Numero par de observaciones. Ahora calcularemos la mediana, cuando se tenga un numero par 
de observaciones. En estos casos, encontramos dos valores en el centra de la serie, por tal razon 
la mediana debera ser el promedio de ellos. 

Ejemplo 2. Supongamos que en vez de 5 datos se tengan 8 datos asi: 


2 4 6 12 18 


x 1 = 8 x 2 = 16 x 3 =4 x 4 =2 x 5 =20 x 6 =3 x 7 = 12 a : 8 = 20 


Ordenamos los datos de menor a mayor o viceversa; 


8 12 

16 20 20 


=> 


M. = 


x J-i 


8 + 12 


= 10 


En los dos casos anteriores, correspondiente al calculo de la mediana para datos sin agrupar, la localiza- 
cion de ella, luego de ser ordenados, se facilita aplicando el siguiente procedimiento: 


n +1 

~T~ 

n +1 

~T~ 


5+1 

2 

8 + 1 
2 


= 3 a position , la mediana en el primer caso o ejemplo 1, sera M = x+ = 6 
y en el ejemplo 2, sera: 

= 4,5 a position , es decir, se encuentra entre la 4 a y la 5 a observation y la mediana 
sera igual a M e = xj = 10, el valor promedio de los dos valores centrales. 


Calculo en datos agrupados o en tablas de frecuencias 

Veamos las formulas que se aplican cuando la variable es discreta y cuando es continua. En cada caso, 
tiene dos procedimientos 

Variable discreta 


Cuando 



La mediana sera igual a: 


M 


■>> i + yj 
2 


Cuando N j A < n / 2 La mediana sera igual a: M e = yj 


Variable continua 


La mediana sera igual a: 


La mediana sera igual a: 


Cuando N jA = n / 2 


Cuando 


N H < "A 


k = 


K =y’j- 1 +<? 

nl -N 1 

/2 ly j- 1 



L j J 
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Pasos a seguir en el calculo de la Mediana Variable discreta 
Ejemplo 3 


Caso A — = — = 15 Se localiza en la columna N. 

2 2 17 

- ft/ 


Cuando Nj_ x - o sea 15 = 15 
Se dice que 


M„ = 


yj-i + yj 


. . 2+3 5 __ 

M e =-= - = 2,5 

* 2 2 


yj.i 

yj 


y, 

n i 

y 

0 

4 

4 

1 

5 

9 

—>2 

6 

15— > 

— >3 

7 

22 — 

4 

8 

30 

i 

30 

— 

Xt 

y 

N, 


* M 

N 

J 


Es decir que la mediana se encuentra localizada entre los valores 2 y 3, siendo igual a 2,5. Tambien se 
puede comprobar el anterior resultado, transformando la distribution de frecuencias en una variable que 
nos muestre los datos originales o que estos se encuentren sin agrupar. 

00001111122222 O 333333344444444 
La mediana se localiza entre los valores ubicados entre la posicion 15 a y 16 a 

Caso B — = — = 15 No se localiza en la columna 


2 2 

Cuando Nj_ t < n / 0 sea c l ue 9 < 15 

Se dice que M e = y . M „ = 2 


y, 


y, 

n. 

i 

N 

j 

0 

4 

4 

1 

5 

9-> 

—>2 

7 

16 — > 

3 

8 

24 

4 

6 

30 

i 

30 

... 

Vi 

f, 

n j 


N. 


La mitad de las observaciones es 15, por lo tanto 
la 15 a y la 16 a corresponden al valor de 2, el cual 
se toma como el valor de la Mediana, como se 
puede ver a continuacion: 


Tal como se hizo en el ejercicio anterior, en datos sin agrupar, el valor central lo ocupa el 2 
00001111122222 fT21 333333344444444 


M ediana Datos agrupados: Variable discreta 


a) M e =- 


yj -1 + y 


Cuando N -_ x = n /, 


b) M e =y. Cuando N hl = n / 


Pasos a seguir en el calculo de la mediana en la Variable continua 

Datos agrupados: Variable continua 


a) M e = y’j_ j Cuando N f j = % 


b) M e =y’ j _ 1 +c 

r w/ _ n ,1 

/2 v v-' 

Si 


n j 
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Ejemplo 4 . 
Caso A 


n 40 
- = — = 20 
2 2 


Cuando N j_ x = ^ 


en este caso N j_ x 


20 


y N, = 30 asi que el valor de la mediana 


M e = y’j-r 70 


Es decir corresponde al valor central que 
toma la variable 


yi i -y, 

y t 

n. 

3 

Nj 

46,1-54 

50 

3 

3 

54,1 - 62 

58 

8 

11 

62,1 - 70 

66 

9 

20 -> 

-->70,1-78 

74 

10 

30 — 

78,1 - 86 

82 

8 

38 

86,1 - 94 

90 

2 

40 

I 

— 

40 

— 

x;_i -x; 

*t 

ft 

Nj 



Algunos autores, utilizan otras simbologias para realizar el anterior calculo, pero el procedimiento 
y resultado son siempre iguales 


i 

i 

i 

i 


M e =L 1 +/ 


n/2-F JA 

' 7 ~. 


i 

i 

i 

i 


Pasos a seguir en el calculo de la Mediana 

a) Obtener en primer lugar las frecuencias absolutas. 

b) Localizar la mitad de las observaciones, por medio de la expresion n/2. 

c) El resultado anterior lo buscamos en la columna de las frecuencias absolutas acumuladas. 
Si no aparece, se toma el valor inmediatamente anterior y lo simbolizamos por A/ . x y al 
inmediatamente superior o posterior por A/.. En caso contrario, cuando dicho valor aparece 
registrado en esa columna, sera simbolizado A/ ._ 1 y el inmediatamente superior posterior por N .. 

d) Cuando aparece n/2, se dice que es igual a N jx (A /.= n/2); en caso contrario, que no aparezca, 
se dira que N j{ < n/2. En ambos casos, dependiendo de si la variable es discreta o continua, 
se aplica la formula respectiva, tal como aparece en el resumen anterior. 
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MODO - MODA O VALOR MODAL M D 

Se define como "el valor de la variable que mas se repite" o " aquel valor que presenta la maxima 
frecuencia” . Puede suceder que una distribucion tenga dos M odas , en este caso se dice que la distribucion 
es Bimodal, en el caso que haya mas de dos modas, se dice que es piurimodal o multimodal. Es la unica 
medida de posicion que puede ser utilizada en atributos, es decir, cuando la caracteristica es cualitativa. 
Modo, M oda 0 valor Modal , medida originalmente concebida, como aquel valor de la variable, que 
presenta el mayor numero de observaciones, es decir, el valor de la variable que mas veces se repite. Se 
empleo formalmente en 1.984 por Karl Pearson, ya que no era utilizado anteriormente. 

Desventajas 

■ El hecho que el modo nos indique el punto de mayor concentracion, lo hace tal vez, la mejor 
medida de tendencia central. Cuando una distribucion es muy asimetrica , claramente se 
ve que el M odo es el mas representativo del grupo, y en algunos casos, si el modo y el 
promedio aritmetico son significativamente diferentes al valor, es preferible usar el modo. 

■ En series pi uri mo dales, el modo permite dividir la distribucion con fines de estratificacion. 

■ Se considera de uso riguroso en variables continuas, aunque puede extenderse a casos 
discontinuos. 

Ventajas 

■ Se le considera con cierto grado de dificultad de calculo en datos agrupados, siendo su 
resultado de poca confianza, especialmente cuando la amplitud no es constante, en este 
caso, si se hace necesario se debe seguir un determinado proceso. 

■ Es muy inestable en el muestreo. 

■ No puede ser utilizado en procesos algebraicos posteriores. 

■ No es sensible, especialmente cuando hay cambios en los valores de la variable, salvo 
que no afecten a su propio valor. 


Datos sin agrupar u originales 

Ejemplo 1. Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12 calculemos la media, 
mediana y la moda. n = 10 

Media —> x = ^ = — = 9 

n 10 

Mediana —> Ordenamos los datos de mayor a menor o de menor a mayor 
5 5 5 5 [_8^10] 10 12 12 18 

La mediana se encuentra entre la 5" y la 6° observacion 

X X 

Siendo: M p = = g M = -- 

2 2 

Moda —» Correspondent a 5, siendo el valor de la variable que mas se repite —> M d = x . = 5 


M 


Posicion: 


n +1 10 + 1 


= 5,5“ 


8 + 10 
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Ejemplo 2. Con dos casos nuevos y con diferentes valores, calculemos otra vez las tres (3) medidas que 
se aplicaron en el ejemplo anterior. 


Caso 1 Con los siguientes datos 

g 

Media —>■ x = — = 9,6 
9 


5 10 8 12 18 5 12 5 12 


Mediana —» Ordenamos los datos de mayor a menor o de menor a mayor 


Posicion: 


— = — = 5° 5 5 5 8 !~10~! 12 12 12 18 

2 2 1 - 1 

M =x= 10 

e J 


Moda —» ncontramos en esta serie de 9 datos, que el 5 y el 12 se repiten veces 
n mero mayor de repeticion por lo tanto ay dos modas y en este caso 
se dice que es bimodal. Si ay mas de dos modas se abla de Plurimodal o 
Multimodal. 

M d = 5 y M d =12 


Caso 2 Con los datos 


13 4 8 12 10 12 16 6 11 


M edia -»x = — = 8 

10 

M ediana -+ Ordenamos los datos de mayor a menor o de menor a mayor 


M 


10+11 

2 


= 10,5 


M oda -» No hay, dado que ninguno de los valores de la variable se repite mas de una vez. 


Datos agrupados 

En datos agrupados, tanto en la variable discreta como en la continua, la M odd correspondent a 
aquel valor que representa la mayor frecuencia. Hay que observar en la variable continua que la amplitud 
del intervalo sea constante. 


a) Variable discreta 


b) Variable continua 



y, 


n 


M l , = y j = 3 



n 


n 


n 


Amplitud constante 

m j = % = 66 
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Como se observa en el ejercicio anterior, primero localizamos el valor de la frecuencia mas alta y 
luego el valor al frente de la frecuencia, en la columna de la variable, correspondera al valor del Modo. 
La frecuencia la simbolizaremos por n., la frecuencia inmediatamente anterior a ese por fl j } y la frecuen¬ 
cia inmediatamente superior por n j+v 


El requisite primordial al calcular el M ocfo, es que la frecuencia absoluta debe ser un valor mayor 
que n. y ademas, menor a: 


7+i ’ 


n ±i <n / <n i +1 


Existen otras formulas, menos importantes, para calcular el M odo, disenadas especialmente para ser 
aplicadas cuando la variable es continua y cuando la amplitud del intervalo es constante. 



Con los datos correspondientes al ultimo ejercicio, de una variable continua, que fue utilizado para 
calcular la M oda, con datos agrupados, sera utilizado en la aplicacion de las formulas anteriores. 


a ) M a =62+8 


8 + 7 


= 62 + — = 62 + 3,73 = 65,73 
15 


b) M d — 62 + 8 


11-8 


(11 - 8) + (11 - 7) 


62 + 8 


62 + 3,43 = 65,43 


c) M d = 62+ 8 


7-8 


2 ( 2 ( 11 )- 8 - 7 ) 



"- 1 “ 

= 62 + 8 


_ 14 _ 


= 62-0,57 = 61,43 


d) M d 


62+8 


8-7 
11 + 7+8 


= 62 + 8 


1 

26 


= 62 + 0,31 = 62,31 


Hemos calculado la Moda en datos agrupados, correspon- 
diente a una variable continua, con una amplitud constante. Ahora 
veamos el procedimiento a seguir cuando no lo es. Por ejemplo: 

Observemos en la tabla adjunta, que el mayor valor registra- 
do en la columna de n/c j es 4,50, por lo tanto el valor correspon- 
diente al Modo, estara al frente, en la columna de las marcas de 
clase (y.). En este caso, se tendra que: 

M„ = y,=83 


y’i-i -y’i 

y t 

n J 

c, 

n j lc i 

46,1-50 

48 

3 

4 

0,75 

50,1-62 

56 

8 

12 

0,67 

62,1-77 

69,5 

11 

15 

0,73 

77,1-82 

79,5 

7 

5 

1,40 

82,1-84 

83 

9 

2 

4,50 

84,1-90 

87 

12 

6 

2,00 

I 

— 

50 

— 

— 

x'i -1 -A 

Xi 

fi 

i 

f/c. 

J 1 l 


Relacion entre la Media, Mediana y el Modo. 


Son tres situaciones que se pueden presentar entre estas tres medidas de posicion. 


M x = M e = M d 


M x <M e <M d 


M x >M e >M d 
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En un poligono de frecuencias, la Moda se ubica en la cima, es decir en la parte superior de la curva o 
linea poligonal. Como termino parroquial, corresponde al llamado horas pico, siendo el tiempo de mayor 
congestion vehicular dentro de la ciudad o de mayor consumo de energia, durante el dia. 


Algunos calculan la moda mediante la formula: 


M d = M x -3(M x -M d ) 


EJERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 


35. Con el siguiente ejercicio, referente a los datos obtenidos sobre el numero de hijos por familia, se 
oide calcular la media, mediana y modo. (n = 20) 


y t 

0 

2 

4 

6 

7 

Xt 

n, 

2 

3 

7 

4 

4 

f, 


36. Con el siguiente ejercicio, referente a una distribucion asimetrica, se pide calcular: la media, 
mediana y modo. (n = 50) 


yi i -y; 

2,75-4,25 4,25-5,75 5,75 -7,25 7,25-8,75 

Vi -x; 

n. 

i 

4 16 25 5 

f, 


37. Con la siguiente serie de numeros, calcule: 2.000 2.500 3.000 3.250 4.000 5.000 6.500 7.500 
50.000 a) La media b) Mediana c) Moda 

d) ^Que factor de la variable afecta la media en esta serie? 

e) /,Cual de las medidas calculadas estima usted mas representativa? 

38. Los sueldos mensuales de 70 empleados de una oficina, son los siguientes: 


OCUPACION 

N° DESEMPLEADOS 

SUELDOS 

Recepcionista. 

2 

642.000 

Mecanografa. 

12 

751.000 

Secretaria. 

8 

758.000 

Aux. Contabilidad. 

10 

794.000 

Tecnicos Electricos.... 

24 

801.000 

Tec. Mecanicos. 

14 

911.000 


Se pide calcular la media, mediana y modo. 


39. Utilizando la siguiente distribucion sobre resistencia a la tension de laminas de acero (en kgrs/) 
obtenga la: media, mediana y modo. 


RESISTENCIA 

10 a 20 20 a 30 30 a 40 40 a 50 

%DE LAMINAS 

0,20 ? ? 0,12 


Nota: Se sabe que la resistencia promedio es de 29,4 kgrs/ 


40. El presidente de un sindicato, clasifico a los companeros de trabajo segun el salario mensual en la 
siguiente forma: 
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SALARIO MENSUAL(Miles $) 

N° DE TRABAJADORES 

Menor o igual a 600 

30 

600,1 ‘ 800 

60 

800,1 ' 1.000 

45 

1.000,1 ' 1.200 

15 

1.200,1 y mas 

50 


41. Calcular el Modo utilizando las diferentes formulas presentadas aqui. 


SALARIOS ($) 

N° EMPLEADOS 

648.000,1 - 668.000 

120 

668.000,1 - 688.000 

38 

688.000,1 - 708.000 

22 

708.000,1 - 728.000 

10 

728.000,1 - 748.000 

6 

748.000,1 - 768.000 

4 


42. Con base en los siguientes datos y medidas de tendencia central, determinar si hay simetria o 
asimetria y cual es su direccion. 

a) x = 68 M = 74 M = 80 c) x = 74 M=14 M =14 

b) x = 80 M = 74 M=6 8 d) x = 74 M=14 M = 60 


43. Consideremos que un vendedor de cigarrillos, vende de lunes a sabado el siguiente numero de 
cajetillas. ^Cual es la media, la mediana y la moda? 

a) 55 60 65 60 65 65 b) 55 60 64 70 65 50 c) 40 36 48 35 100 35 

44. Con los siguientes datos, correspondientes a dos submuestras, se pide calcular: 


x , 

4 

6 

7 

6 

10 

6 4 15 6 

y, 

10 

18 

12 

20 

8 

10 


a) La mediana, moda y media aritmetica para cada una de las variables. 

b) La media conjunta de las dos submuestras. 

45. Con los siguientes datos calcular la media, mediana y el modo. 


yu-y} 

3,1-8 

5,1-9 

10,1-16 16,1-24 

24,1-30 

30,1-32 

i -x] 

n 

i 

8 

8 

14 16 

18 

10 

ft 


46 Una muestra realizada a 12 profesores de tiempo completo, en Universidades privadas de la capital, 
se encontro que su sueldo quincenal en miles de $, es de: 1.800, 720, 750,1.680, 900, 720, 840. 810, 
720, 810, 720, 840. Calcular la media, mediana y la moda de estos salarios ^Cual cree usted que sea 
el mejor promedio? ^Por que? 

47. Si al realizar los calculos en una distribucion, se obtienen los siguientes resultados: x = 36 
M = 32; = 23 y se desea corregirlos /,Cuales serian los nuevos promedios en los casos 

siguientes: a) Cada uno de los valores se incremento en 5 unidades? b) La variable esta dada 
en anos y se desea que este dada en meses? 
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48. Una corporation financiera, en los ultimos 9 meses ha hecho captaciones en dinero con interes 
anual de: 7,9% 8,3% 6,1% 6,8% 7,4% 8,6% 8,2% 7,6% y 8% ^Cual es la media, mediana y 
moda de estos valores? 

49. Se tiene el control de llegada (en minutos) de un empleado a su oficina, cuando llega temprano 
se tendra tiempo a su favor (+) y sus retardos podran ser compensados (-) Se le realizo un control 
durante 8 dias habiles, asi: 12 -8 15 -12 -6 10 -8 y -18. Calcular la media, mediana y la moda. 

50. Con los siguientes datos, calcular la media, mediana y moda. 


yh-y’i 

2,1-5 

5,1-9 9,1-16 

16,1-20 

20,1-28 

28,1-36 

V \-x’i 

n 

i 

120 

15 8 

6 

6 

4 

fi 


MEDIA GEOMETRICA M r M n G 

Se considera como una medida de position o promedio, pudiendo utilizarse cualquiera de estos simbolos 
y el resultado obtenido debera ser menor al de la M edia aritmetica. Se aplica en todos aquellos casos en 
que la variable muestra un crecimiento geometrico, como sucede con la poblacion o que se encuentre 
relacionada con ella, ademas, como en el caso de un capital colocado a una tasa de interes compuesto, 
durante un determinado periodo de tiempo. 

La M edia geometrica se define como “la raiz enesima del producto de los valores que toma la variable" 



Observemos que el signo n se lee productoria , siendo este simbolo la forma de expresar que los 
valores correspondientes a la variable deben estar multiplicados entre si. 


Ventajas 

■ Se define rigidamente mediante una formula matematica. 

■ Se utiliza cuando se quiere dar importancia a pequenos valores que toma la variable. 

■ Es sensible a cualquier cambio que se haga en los valores de la distribution. 

■ Su valor no es muy influenciado por valores extremos grandes, tal como sucede con los otros 
promedios. 

■ Se hace indispensable, cuando se desea calcular el promedio en una serie de valores que estan 
dados en progresion geometrica o aproximadamente. 

■ Su resultado puede ser utilizado en procesos estadisticos posteriores, puesto que los promedios 
geometricos en diferentes muestras, pueden ser combinados para el total de la muestra. 

Des ventajas 

■ Es bastante complicado el proceso de calculo. 

■ Si cualquier valor de la serie es cero, el promedio sera cero, dependiendo de la formula 
empleada. 

■ Si un valor de la serie es negativo, su valor sera negativo o imaginario. 
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Calculo en datos sin agrupar. 


Ejemplo 1. Supongamos que se tienen 5 observaciones (n = 5) cuyos valores son: X ( .: 6 4 8 2 5. Se 
pide calcular la media geometrica 

Solucion: 


M 0 = 5/6.4.8.2.5 = 5/1.920 = 4,54 


Esta formula presenta algunos problemas en su aplicacion: a) Si un valor de la variable 
es cero el producto sera cero y su raiz cero. b) Si uno de los valores es negativo, el 
producto sera negativo, por lo tanto se tendra una raiz imaginaria. c) Si el valor de H 
es grande, sera tedioso su calculo. 


Frente a la anterior situacion es preferible utilizar los logaritmos. Veamos el procedimiento: 
M 0 = ^J%x~ = nx] /n <=> log M 0 = 


g log*. 


-pi \ Slogx log6 + log 4 + log8 + log 2 + log5 

Reemplacemos y se tendra que logM 0 =-- = — 2 - 2 - 2 - 2 -— 

n 5 

t B , 0,77815 + 0,60206 + 0,90309 + 0,30103 + 0,69897 3,28330 A 

log M 0 = ---= — -= 0,6!) 666 

M 0 = anti log de 0,65666 = 4,54 El mismo resultado obtenido anteriormente. 


Calculo en datos agrupados. 


Ejemplo 2. 


y, 

n t 

logj, 

»,log y t 

1 

4 

0 

0 

2 

5 

0,30103 

1,50515 

3 

7 

0,47712 

3,33985 

4 

8 

0,60206 

4,81648 

6 

6 

0,77815 

4,66891 

L 

30 

- 

14,33039 

x t 

f, 

log*, 



Solucion: 


log M 0 = 


^,logJ, 

n 


14,33039 

30 


0,477680 


M 0 = analog 0,477680 = 3 


logM 0 = 


n 


Ejemplo 3. 


y, 

n i 

y, n ' 

1 

4 

1 

2 

5 

32 

3 

7 

2.187 

4 

8 

65.536 

6 

6 

46.656 

E 

30 

-- 

Xt 

ft 

xf 


Solucion: 

M 0 =rfOyF 

M 0 = 3 ^lx32x2.187x65.536x46.656 = 3,00 

Como lo podemos observar, en los dos ejercicios que se acaban de realizar 
los resultados son exactamente iguales. Este ultimo calculo hizo ver 
que el anterior procedimiento fiiera se considerara mas engorroso. 
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Ejemplo 4. La media aritmetica de 3 numeros es 8, la mediana es 8 y la media geometrica es M 0 = V480 
Se pide calcular los valores de esos tres numeros. 


Solution: 

Af,=8 M g = t 

24 = x x + x 2 + Xn 


M b = V480 


a/480 = \jx } x 2 x 3 

24 = x i + 8 H - Xj 


X 

ii 

o 

o© 

24-8= x,+x 3 


60 =x y x 3 

16= x, + *3 





^3 


Reemplazando 16 =jc,+jc 3 o 16=— + x 3 o 16jc 3 = 60 + jc 3 2 

*3 

Despejando se tiene que jc 3 -16x 3 + 60 = 0, de donde: x ] = 6 jc 2 = 8 jc 3 = 10 


(Teniendo en cuenta dos numeros que sumados den 16 y multiplicados 60) 


Ejemplo 5. Supongamos que un pais tuvo en 1997 una poblacion de 8 millones y subio a 12 millones 
para el 2011. ^Cual sera el promedio (media) de poblacion para ese periodo? 

M 0 = Jx t .x 2 = ^8(12) = V% = 9,8 Millones de personas 

Ejemplo 6. Supongamos que un capital de $50,000 sea colocado a una tasa anual del 24% el primero de 
enero del 2.008. Si se capitaliza los dias primero de enero, calcule el promedio del dinero invertido entre 
el 31 de diciembre del 2.008 y el 31 de diciembre del 2011. 

Solution: 


ANOS 

*/ 

log X, 

2008 

50.000 

4.698970 

2009 

62.000 

4,792392 

2010 

76.880 

4.885813 

2011 

93.331,2 

4,979235 

I 


19,356410 


log M 0 = 
logA/„= 


Slog*, 

n 


19,356410 

4 


= 4,8391025 


M 0 = ami log 4,8391025 =69.040,27 


(Promedio de dinero invertido 
durante el periodo) 


MEDIA ARMONICA: M„ M 


Este promedio, menos importante que los tres anteriores mencionados, se aplica en especial cuando 
la variable esta dada en forma de tasas o cuando se trata calcular la velocidad media. Vale la pena 
decir, que esta medida le da gran importancia a aquellos valores pequenos de la variable, contrario 
a la media aritmetica. 


Se define, diciendo que: dada una serie de datos, el inverso de la media armonica, es igual a la 
media aritmetica del inverso de los valores de la variable. 




= M 


x < 


Por lo tanto se tendra que 



6 


M h 
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Ventajas 

■ Se usa con preferencia en el calculo de la velocidad media. 

■ De gran utilidad cuando la variable esta dada en forma de tasas. 

Des ventajas 

■ Que un valor de la variable sea cero. 

■ El promedio armonico esta rigidamente definido por una formula matematica, su 
valor depende de cada uno de los datos de la distribucion y su resultado no puede 
ser utilizado en calculos posteriores. 


Datos no agrupados 

Ejemplo 1. Supongamos que se dispone de 10 observaciones, cuyos valores son: 


X. = 8286226824 Con ellos se desea calcular la media armonica, aplicando la formula 
anterior. 


M_,= 



Si comparamos este resultado, con el de la media aritmetica aplicada a los mismos datos, siendo 
igual a 4,8, notaremos que es inferior, hecho que se dara en todos los ejercicios que realicemos, siendo: 


Datos agrupados 


Ejemplo 2. Con los datos correspondientes a una tabla de frecuencias, tal como aparece a continuacion, 
tanto para la variable discreta como la continua, la Media armonica sera: 


1- VARIABLE DISCRETA 


y, 

n, 

n Jy, 

i 

4 

4,00 

2 

5 

2,50 

3 

7 

2,33 

4 

8 

2,00 

6 

6 

1,00 

E 

30 

11,83 

X 

fi fJx 


(1) m h 
m h 

(2) M h 
M h 


30/11,83 = 
2,54 


50/0,70 = 
71,43 


2 - VARIABLE CONTINUA 


yi.]-yi 

y, 

n x 

n i A 

46,1-50 

50 

3 

0,06 

50,1 -62 

58 

8 

0,14 

62,1 -77 

66 

11 

0,17 

77,1-82 

74 

7 

0,09 

82,1-84 

82 

9 

0,11 

84,1-90 

90 

12 

0,13 

E 

— 

50 

0,70 

V-,-V 


fi fix 


Lo mismo que en datos sin agrupar, los anterinres resnltadns en datos agrupados, deben ser inferio- 
res a los obtenidos aplicando la media aritmetica. 


Formula aplicada en datos agrupados 



115 
























116 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


Ya se menciono al definir la media armonica, que una de sus aplicaciones se realizaba al calcular 
la velocidad media , es decir, cuando hay necesidad de relacionar tiempo con velocidad. Supongamos 
disponer de la siguiente informacion: 


S. = V. t. 

i i i 



S=espacio V.= velocidad t= tiempo V m = velocidad media 
Siendo S = S', + S 2 +. Total de espacio 


Ejemplo 3. Consideremos, un auto recorre 60 km a una velocidad promedio de 100 km. por hora y 
luego, los siguientes 40 km. a una velocidad media de 80 km. por hora. ^Cual sera la velocidad media 
del recorrido total? 


Solution: 

v x =100 V 2 =80 S } =60 S 2 =40 





100 

0,6 + 0,5 


-= 90,9 Velocidad media 

1,1 


A continuation veremos una forma erronea en la aplicacion de la media aritmetica. En este caso 
en particular, debe aplicarse la media armonica 


Ejemplo 4. Un grupo de trabajadores producen 120 papeleras para escritorio, en un promedio diario de 
12 papeleras. Una vez terminado ese contrato, se dedican a producir otras 120 papeleras, a razon de 8 por 
dia. Se desea determinar la productividad diaria en la elaboracion de las 240 papeleras. 

Solution: 

Si calculamos la media aritmetica obtendriamos un resultado erroneo 

x - ^ + ^ ^ 15 Papeleras diarias 

n 2 

Se observa que las primeras papeleras se realizan en 10 dias (120/12 = 10) y las siguientes pa¬ 
peleras en 6,67 dias (120/8 = 6,67); las 240 papeleras se harian en 16,67 dias; si son 16,67 y el rendi- 
miento por dia es de 15 se tendrian un total de 250 papeleras, cantidad diferente a las 240 papeleras 
del problema 

2 2 

Mediante la media armonica se tiene: M , = —? -— 7 - =-= 14,4 

Xi+Xs wm 

La aplicacion de la media no es correcta, debido a que existe una relacion inversamente proporcio- 
nal. Con la media armonica, el numero de papeleras producidas diariamente es de 14,4, que a la vez mul- 
tiplicadas por 16,67 dias nos daria un total de produccion de 240 papeleras durante ese periodo, diferente 
a las 250 como resultado al aplicar la media. 















CAPITULOTRES 

MEDIDAS DE POSICION Y DE TENDENCIA CENTRAL 


EJERCICIOS PARA RESOLVER 


La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 



51. Calcule la media geometrica y la media armonica en la siguiente distribucion de seis intervalos de 
amplitud constante, de la cual se sabe: 

W= 150 7=60 } \= } \ } h =' 7 4 = 30 n 2 = n $ = n } + 5 7 = 45 

N= 150 * = 60 /, =/ 6 / 3 =/ 4 = 30 f 2 =f 5 = /, + 5 X = 45 j 

52 Halle la media aritmetica, media geometrica, modo y mediana con los siguientes datos sin agrupar: 
3 6 13 22 46 89 y conteste ^Cual de estas medidas es mejor y por que? 


53. Con los siguientes datos: 2 5 8 12 y 20 

a) Calcular la media aritmetica, media geometrica y media armonica. 
Observar que 


M > M > M 


b) Calcular la media, la mediana y la moda. Observar en cual de las dos situaciones se presenta: 
o 


M, > M > M 


M, < M < M 


54. Los gastos (miles de millones de $) en publicidad de 50 empresas comerciales, durante el mes de 
diciembre de 2011 agruparon en 4 clases de amplitud constante, de la cual se sabe: 

Yr 3,5 ypp5 h^4 20 n 3 = 25 

r xp=3j — T;=8T75 — — T X = V — ~F 2 ~20~ — ~1 = 25 n 

I_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _l 

Se pide calcular la media aritmetica y la media geometrica. 

55. Una persona maneja su automovil durante 400 kilometros. Los primeros 120 km viaja a razon de 
60 km por hora; los siguientes 120 a 100 km por hora; el 25% del total lo hace a razon de 80 km por 
hora. iK que velocidad debe viajar el resto, para tener en total una velocidad promedio de 70 km 
por hora? 


56. Un avion vuela una distancia de 900 km. Si cubre el primero y el ultimo tercio del viaje a 250 km 
por hora y el tercio medio a 300 km por hora, se pide calcular su velocidad media. 


57. Una persona viaja durante 4 dias. Diariamente recorre 200 km, pero maneja el primero y el ultimo 
dia a 50 km por hora, el segundo a 55 y el tercero a 60 km por hora. ^Cual es la velocidad media 
durante el viaje? 

58. Una persona viaja en coche de la ciudad “A” a la “B” con una velocidad media de 40 km por hora 
y vuelve de la ciudad “B” a la “A” con una velocidad media de 60 km por hora, hallar la velocidad 
media del viaje completo. 

59. Las ciudades A, B y C, son equidistantes entre si. Un motorista viaja de A a B a 30 km por hora, de 
B a C a 40 km por hora y de C a A a 50 km por hora. Determinar el promedio de velocidad para el 
viaje completo. 

60. Durante un mes se construyeron 134 kilometros de carretera en la siguiente forma: la primera 
semana 3,6% del total, la segunda semana 7,6% del total, la tercera semana 15,3%, la cuarta semana, 
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24,5% y la ultima 49%. Halle la medida de tendencia central que represente mejor el promedio de 
la distribucion, en kilometros por semana. 

61. Se sabe que dos obreros gastan en la ejecucion de un trabajo 50 y 40 minutos respectivamente, i cual 
es el tiempo medio requerido para hacerlo en conjunto? 

62. Un grupo de trabajadores produce 140 papeleras para piso con una productividad de 14 papeleras 
diarias; una vez terminado ese contrato se dedica a producir otras 140 papeleras razon de 10 por dia. 
Se desea determinar la productividad diaria en la elaboracion de las 280 papeleras. 

63. Una persona va a tres tiendas del barrio a comprar azucar; los precios son como siguen: 


Si la persona compra azucar en dos formas diferentes. La primera forma 
consiste en que compra 3 paquetes en cada tienda. La segunda forma 
corresponde a comprar en cada tienda el equivalente de $10,000 en azucar. 


a) ^Cual es el precio promedio por paquete que la persona paga cuando compra el azucar de la 
primera forma? 

b) ^Cual es el precio promedio por paquete cuando lo compra de la segunda forma? 

64. En una tabla de frecuencias, se clasifican 50 datos utilizando 4 intervalos de igual magnitud. Se pide 
calcular la mediana y la media armonica sabiendo que: 

y 2 = 50 n { = 4 N 2 = 20 n 3 = 25 7=62,4 

65. Se sabe que dos obreros gastan en la ejecucion de un trabajo 150 y 140 minutos respectivamente 
/,Cual es el tiempo medio requerido para hacerlo en conjunto? 

66 . Un fabricante dispone de $100,000, para la compra de cierta materia prima. Durante tres anos invierte 
la misma cantidad de dinero. Si el precio promedio por kilo en los tres anos sucesivos sube de $1,200 
a $1,800 y a $3,600. ^Cual es el precio promedio que ha pagado el fabricante en dicho periodo? 


TIENDA 

PRECIO 

A 

$2,250 

B 

$2,830 

C 

$2,570 


67. Con la siguiente distribucion: 


yi. i- yi ■■ 

10-15 15-20 20-25 25-30 30-35 

n, : 

3 7 15 25 10 


Se pide calcular la mediana y la media armonica. 


MEDIA CUADRATICA: M 2 


Se usa con muy poca frecuencia esta medida de tendencia central. Es un promedio que involucra a 
los cuadrados de las cantidades promediadas. La desviacion estandar o tipica de la cual hablaremos en la 
proxima unidad, es una media cuadratica. Es utilizada a menudo con el fin de reducir la media al mismo 
grado de los valores promediados, siendo la razon por la cual se calcula la raiz cuadrada de la misma, 
despues de haber realizado el procedo de su promedacion. 


Se define como la raiz cuadrada de la media aritmetica, de los cuadrados de los valores que toma 
la variable". 
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Formulas: Datos sin agrupar 


Datos agrupados: 


o M 2 =. 


Zx 



i M 2 = 


Vt'f, 


N 


Ventajas 

■ Es de importancia en algunos problemas de probabilidad, siendo teoricamente 
recomendable trabajar con el cuadrado de los valores. 

Des ventajas 

■ Su formula esta definida rigidamente por una formula matematica. 

■ Se deja influenciar mucho por valores extremos, especialmente cuando estos son 
demasiado grandes. 


Datos sin agrupar 


Ejemplo 1. Supongamos que se tienen 6 observaciones, cuyos valores son: x.= 2 6 5 

se desea calcular la media cuadratica de esos seis numeros. 


M 


■ 


2 2 + 6 2 + 5 2 + 4 2 +6 2 +8 2 


31 

= 5,49 La media hubiese sido x = — = 5,17 

6 


4 6 8 y 


Ejemplo 2. Consideremos los datos de la tabla siguiente para calcular la media aritmetica y la media 
cuadratica. 



Media: y = = — = 3.43 

n 30 



Media cuadratica: M, = J — — =J-— = 3,79 
2 y n v 30 

En los dos casos, donde hemos calculado las dos medias, permite observar 
que M , < M 2 (La Media aritmetica es menor que la media cuadratica) 
3,43 < 3,79 


MEDIA CUBICA: M 3 

Este promedio, al igual que el anterior es poco conocido y por lo tanto de uso limitado. Se define como 

“la rafz cubica de la media aritmetica de los cubos de los valores de la variable” 



Dates sin aeruoar Datos amipados 
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Datos sin agrupar 

Ejemplo 1. Consideremos nuevamente los datos no agrupados, que fueron utilizados para calcular la 
Media cuadratica x, = 2 6 5 4 6 8. 


M, 




2 3 +6 3 + 5 3 +4 3 + 6 3 +8 3 


= 5,75 


M, < M, < M 3 


Veamos: 3,43 < 3,79 < 5,75 por lo tanto se cumple la anterior relacion. Si relacionamos estas tres 
medidas, con la media geometrica y la media armonica, observamos que: M < M 0 < M t < M < M 3 que 
el lector podra comprobar desarrollando un ejercicio que involucre el calculo de estas medidas. 

Datos agrupados 

Ejemplo 2. Con los siguientes datos, correspondiente a una tabla de frecuencias, se podra calcular la 
Media cubica. Veamos como es el proceso: 


y. 

n i 

y "< 

y 2 

V", 

i 

4 

4 

4 

4 

2 

5 

10 

20 

40 

3 

7 

21 

63 

189 

4 

8 

32 

128 

512 

6 

6 

36 

216 

864 

S 

30 

103 

431 

1.609 

Xi 

fi 

Xifi 

XJf 

x-f, 


M 


-i 


1 3 (4) + 2 3 (5) +.6 3 (6) 

30 


_ 11.609 
V 30 


= 3,77 


M = 


- 3i 




I 


IM, 


Ejemplo 3. Co nside remos que la media aritmetica de tres numeros es 7, su mediana es 6 y su media 
geometrica es V 216 . Se pide calcular la media cuadratica y la cubica. 

Solution: 


x = 7 
x, + 6+ x 


M e = 6 M 0 =-y/2\6 


X =■ 


7 => 21 jfj + 6 + X 3 => 15 — V| +jr 3 


M 0 = V2I6 = \[x t jc 2 .x 3 = \[x t (6)x 3 o 216 = x,(6)x 3 

216 .. 36 n . , 1C 36 

-= x,.x 3 => 36 = x, jc 3 => x, = — Reemplazando 15 = — + x 3 se tiene que 

6 ’ x 3 x 3 

15x 3 =36 + x 3 <=> x 3 2 -15x 3 +36 =0 Siendo: x,=3 x 2 =6 y x 3 = 12 

^ 3 2 + 6 2 + 12~ ^9 + 36+144 


La media cuadratica sera: A/, 


I3 3 + 6 3 +12 3 127 + 216 + 1.728 


= 7,94 

= 8,69 


La media cubica sera: 


3 
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RELACION ENTRE LAS MEDIDAS DE TENDENCIA CENTRAL O PROMEDIOS. 

a) Cuando tratamos la media aritmetica, la mediana y la moda, mencionamos algunas 
relaciones existentes entre ellas 

x = M = M , En este caso la Distribucion se considera Simetr'lCd 

e a 

x > M e >M d Se dice que la Distribucion es Asimetr'lCd positiva 
x < M e < M d Es un caso de Distribucion A Simetr'lCd negativa 
Los tres casos anteriores seran nuevamente mencionados en el Capitulo siguiente. 

b) Si la distribucion es convexa y moderada asimetrica, la M ediana se ubica entre la 
M edia y el M odo , quedando aproximadamente, dos veces mas lejos de este ultimo 
que del primero. x - M d = 3( x -M e ) y M d = 3 M d -2x 

c) En cualquier distribucion, donde los elementos originales difieren en tamano, las 
siguientes medidas diferiran en valor, de acuerdo al siguiente orden. 

M <M 0 <M l <M<M 3 


CENTRO RECORRIDO C R 

Esta medida poca utilizada, se define como la media aritmetica de los valores extremos que toma la 


variable. 


V , + Y / 

r* _ max m m 

^ _r,»+ri 

^ _y’ m + yb 


r 2 

e» — 

' 2 

L « — 

' 2 


(Datos sin agrupar) 

(Variable discreta) 

(Variable continua) 


Ejemplo 1. Supongamos que se tiene la siguiente informacion, correspondiente a datos sin agrupar: 


X ; =2 


6 5 4 6 8 




12 7 6 
12 + 2 
2 


10 Su centro recorrido sera: 


Ejemplo 2. Su aplicacion tanto en la variable discreta como en la continua, se puede observar a 
continuacion. 


y, 

", 

i 

4 

2 

5 

3 

7 

4 

8 

6 

6 

£ 

X, 

30 

f, 


y m ^6 


c = y - +y ' b)C r = 
r 2 2 


C,-5±l-W 70 


En ninguno de los dos casos se tiene en cuenta, 
el valor que tomen las frecuencias absolutas. 
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CUARTILES, DECILES Y PERCENTILES 


Cuando la distribucion esta constituida por un numero grande de intervalos o de marcas de clase, 
haciendose necesario calcular un promedio sobre una parte de ella, en estos casos, la distribucion puede 
ser distribuida en cuatro, en diez o en cien partes. En el primer caso nos referiremos a Cuartiles , en el 
segundo a D eciles y en el tercero a Percentiles o Centiles. 

En el primero o sea los cuartiles, se podra obtener: Q ] como primer Ciiartil , Q 2 segundo Ciiartil y Q 3 
correspondiente al tercer Ciiartil. 

El primer cuartil, es aquel valor de la variable que supera al 25% de las observaciones y a la vez es 
superado por el 75%. 

El segundo cuartil, es aquel valor de la variable que supera al 50% de las observaciones y a la vez 
es superado por el 50%. Es decir, corresponde a la Mediana 

En los deciles, el septimo decil, es aquel valor de la variable que supera al 70% de las observaciones 
y a la vez es superado por el 30%. 

Y en los percentiles, el percentil cuarenta , es aquel valor de la variable que supera al 40% de las 
observaciones y a la vez es superado por el 60%. 

Tal como lo mencionamos, el segundo cuartil, el quinto decil y el percentil cincuenta, en una misma 
distribucion presenta el mismo resultado, siendo en los tres casos igual al de la mediana. 

Datos no agrupados 


Ejemplo 1. Con los siguientes datos: 16 10 4 8 12 10 8 20 4 13 12 22 16 26 20, 

se pide calcular a) Primer y tercer cuartil. b) Cuarto y sexto decil y c) el 30 y 90 percentil. 


a) 


Lo primero que se hace, es ordenar los datos de menor a mayor o viceversa. 

4 4 8 8 10 10 12 12 13 16 16 20 20 22 26 n = 15 

a) Para el primer cuartil , aplicamos el siguiente procedimiento, muy parecido al calcular la 

.. * . l(j?+1) 1(15 + 1) 

mediana, es decir: —- = — ~ = 4 a posicion Q x = x J = 8 

Para el tercer cuartil : ^ _ 3(15^t-1) p OS j c j6 n q : - x . = 20 


b) Cuarto decil : 


4(w + l) _ 4(15 + 1) 
10 


= 6,4 a posicion . Observemos que el proceso correspondiente al 


resultado obtenido es diferente a los dos anteriores, pues aparece con la posicion de 6,4, es decir, que 
debe estar entre la sexta y la septima posicion, siendo el valor de 10 la sexta posicion y la diferencia entre 
la T y 6 a es 12-10=2, este resultado se multiplica por la fraccion 0,4, asi 2(0,4)=0,8 y se lo agregamos al 
valor anterior de 10, siendo: D A = x } = 10,8 


El sexto decil , sera: 


6(/7 + l) 6(15 + 1) 


= 9,6 a posicion. El valor correspondiente a la novena 


10 10 

posicion es 13 y se tiene ademas, 0,60(16-13) = 0,6(3) = 1,8. Por lo tanto Z> 6 = 14,8 


c) Percentil 30 sera: 


30(/7 +1) _ 30(15 + 1) 
100 " 100 


= 4,8 a posicion. El valor de la cuarta posicion es 8, 


ademas se tiene que, 0,8(10 - 8) = 1,6. Por lo tanto P 30 = 9,6 
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El Percentil 90 sera: 


90(» + l) 90(15 + 1) 

Hoo 100 


= 14,4 a position .El valor en la posicion 14 es de 22, 


ademas, 0,4(26 - 22) = 1,6, se tendra que P w = 23,6 


Datos agrupados 

El calculo de los cuartiles, deciles y percentiles es bastante parecido al 
procedimiento que se habi'a utilizado para calcular la Mediana, salvo 
una pequeiia variacion, al establecer la posicion donde se debe ubicar 
la respectiva medida. 

Los pasos a seguir en los calculos son: 

■ Se detenuinan las frecuencias absolutas acumuladas. 

■ Determ inamos la position donde se localiza. 

■ Observamos si el valor obtenido en el paso anterior, aparece o 
no en dicha columna, correspondiente a las frecuencias 
absolutas acumuladas. 

■ Se aplica la formula respectiva, dependiendo de la variable 
trabajada. 


yl\ 

-y'i 

", 



2,1 

6 

3 

3 

4 

6,1 

- 10 

12 

15 

8 

10,1 

- 14 

10 

25 

12 

14,1 

- 18 

18 

43 

16 

18,1 

- 22 

10 

53 

20 

22,1 

-26 

6 

59 

24 

26.1 

-30 

20 

79 

28 

30,1 

-34 

8 

87 

32 

34,1 

-38 

3 

90 

36 

l 

90 

- 


X-, 

-X 

ft 


X, 


Se pide calcular: 

a) C uartu tres. La posicion se da asi: 


3 (rj) 

4 


3(90) 

4 


= 67,5* posicion. Observemos que este valor 


no aparece en la columna de las frecuencias absolutas acumuladas, por tal razon, seleccionamos 
el valor inmediatamente anterior (59) como H. y al valor inmediatamente superior teniendo a 
79 como Nj. Ahora veamos las formulas a aplicar dependiendo de la variable. 

Variable Discrete — >Q 3 = y. = 28. Como se observa, se toma el valor de y. al frente de N. si 
consideramos a las marcas de clase como variable discreta. 


Variable Conti nua. En este caso nos ubicamos al frente de los intervalos y aplicamos la formula 
parecida a la utilizada al calcular la M ediana, con una ligera modificacion: 


ft =y’j-i+c 


"h 


= 26 + 4 


67,5-59 


20 


= 26+1,7 = 27,7 


Observemos que el valor de 26 fue seleccionado en el intervalo correspondiente a N . 

b) D ecil seis Determinamos la posicion asi: _ 54 a Como este valor no aparece en la 

10 10 

columna de las frecuencias absolutas acumuladas, se toma a A/. ,=53 y a A/. =59. 

Ahora observemos el procedimiento a seguir en ambas variables. 

Variable Discreta —> D 6 = y. = 24 (Marcas de clase). 


Variable Continua —> D b 


22 + 4 


54-53 

6 


= 22 + 0,66=22,66 


c) Percentilil 80. La posicion es: = 72 “position. Al igual que en los dos casos 

100 100 

anteriores, se deberan aplicar los mismos procedimientos para esta tab la. A/._,= 59 y para A/.= 79 
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Variable Discreta 
Variable Contirma 


P g0 = y =28 (Marcas de close}. 


=26+4 


72-59 


20 


= 26 + 2,6 = 28,6 


EJERCICIOS MISCELANEOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el SIL. 


68 . Una compama de aviacion que ofrece un vuelo diario a una determinada region del pais no cumplio 
con el horario de llegada en los ultimos 10 dias de abril, con los siguientes minutos de retardo o de 
anticipacion (numero negativo): 


-3 6 4 10 -4 124 2 -1 4 1 

a) Si la compama contratara un especialista en estadistica para mostrar el cumplimiento, ^cuales 
serian las medidas que utilizaria? 

b) Si el objetivo fuese mostrar que ofrece un buen servicio (cumplimiento), ^que medida 
utilizaria? 

Si el objetivo es mostrar un mal servicio de una compama con la que el desea competir ^que 
medida utilizaria para lograrlo? 


69. Explique brevemente: 

a) Tres ventajas de la media b) Dos desventajas de la mediana 

c) Dos ventajas de la moda d) ^En que condiciones seran iguales la media, mediana y moda? 

70. Con los siguientes datos, se pide calcular: 


a) Media aritmetica 

b) Mediana 

c) Moda 

d) Tercerdecil 

e) Segundo cuartil 
0 Percentil sesenta 

71. Un grupo de 400 empleados, que tiene una compama, se dividen en operarios y tecnicos con un 
salario promedio de $ 1.260.960. Los salarios promedio para cada uno de los grupos son de $857,300 
y $1,320,856 respectivamente. 

a) ^Cuantos operarios y cuantos tecnicos tiene la compama? 

b) Si el gerente establece una bonificacion de $30,000 para los operarios y del 8% para los tecnicos, 
^cual sera el salario promedio para los 400 empleados de la compama? 


.tf-i - yi 

«/ 

6,1 - 12 

2 

12,1 - 15 

14 

15,1 -20 

5 

20,1 - 28 

3 

28,1 - 36 

7 

36,1 - 40 

16 

40.1 - 50 

3 

I 

50 


72. ^Que es un promedio?. ^cuales podria mencionar?; ^que condiciones debe tener el promedio para 
cumplir su cometido, mencione tres? 


73. Con los datos del ejercicio N° 45, se pide calcular: la media cuadratica, la cubica y el septimo decil. 
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74. Con los siguientes datos: 

X, =4 X = 10 X =6 X =4 X = 4 X = 12 

a) Comprobar que < M 0 < M 1 < M 2 < M 3 

b) Suponga que al calcular la mediana, media aritmetica y moda, estos resultados provienen de una 
distribucion de frecuencias. ual seria su relacion, es decir, simetrica o asimetrica? 

75. Suponga que los salarios pagados a los empleados de una compania, son como se representa a 
continuacion: 


CARGOS 

NUMERO 

SALARIO MENSUAL 

Directores 

2 

1.930.000 

Supervisores 

4 

1.510.000 

Economistas 

6 

1.370.000 

Contadores 

4 

1.350.000 

Auxiliares 

26 

646.000 

Obreros 

110 

590.000 


Se pide: 

a) Calcular la media, mediana y moda. 

b) En su opinion. ^Cual de estos promedios considera mas representativo? 

76. En una fabrica de tres secciones se sabe que en la seccion A, con 120 obreros la asistencia promedio 
es de 240 dias al ano; en la seccion B, que tiene 180 operarios, la asistencia media es de 216 dias al 
ano. Si la asistencia media en toda la fabrica es de 226,70 dias. ^cuantos obreros hay en la seccion 
C, donde la asistencia promedio es de 230 dias al ano? 

77. Durante diez dias se observo en un almacen de autos, el numero de estos vendidos por su empleado 
estrella. 


DIA: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

AUTOS: 

3 

4 

2 

1 

3 

2 

4 

6 

5 

4 


Cada auto vale $18,500,000 y al empleado se le paga un sueldo de $270,000 basico mensual mas 
el 0,5% del valor de cada auto vendido. ^Cual sera el sueldo promedio para el vendedor estrella en 
este lapso de 10 dias? 

78. Se sabe que el salario mensual promedio de los empleados de una empresa es de $1,052,000. El 
total de los empleados se aumenta en 20% con relacion a los que habia hasta la fecha. Los nuevos 
empleados tienen salario mensual promedio igual al 36,8% de salario promedio de los antiguos. 
Un ano despues se hace un aumento de $57,600 a todos los empleados de la empresa. ^Cual sera el 
salario promedio de la empresa actualmente? 

79. La siguiente es la poblacion de 3 zonas de un Departamento en que se encuentra dividido el pais 
segun los censos de 2001 y de 2011 
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Calcule la poblacion total de las treszonas del Departamento para 
una fecha equidistante entre los dos censos, suponiendo que: 

a) El porcentaje (tasa) de aumento poblacional es constante en 
todoel Departamento. 

b) El porcentaje (tasa) de aumento es constante en cada zona del 
Departamento. 


Con la siguiente distribucion, calcular: 

a) La media, mediana y modo. 

b) La media cubica, cuadratica, armonica y geometrica. 


81. Contestar verdadero si el enunciado es verdadero. En caso contrario, la palabra subrayada debe 
sustituirse por una expresion con la cual el enunciado si sea valido. 

a. La media de una muestra divide los datos en dos mitades iguales: la mitad mayores y la mitad 
menores que su propio valor. 

b. La media armonica es la raiz enesima del producto de los valores que toma la variable. 

c. El decil ocho representa aquel valor de la variable que supera el 80% de las observaciones y es 
superado por el resto 20%. 

d. Una distribucion o un conjunto de datos, permite el calculo de varias medidas de tendencia 
central. 

e. Un promedio aplicado o calculado en un conjunto de datos provenientes de una muestra, se 
denomina parametro. 

82. Explique brevemente los siguientes puntos: 

a. Cuatro condiciones para que los promedios puedan cumplir su cometido. 

b. Cuatro reglas que deben ser tenidas en cuenta para el uso de los promedios. 

83. Se sabe que la media aritmetica de dos numeros es igual a 5 y la media geometrica de los mismos 
es igual a 4. ^cual es la media cubica? 

84. En una empresa constructora de vivienda, los jomales semanales tienen una media de $169,000. 
Como una solucion al conflicto laboral surgido, se proponen dos soluciones al conflicto: (a) un 
aumento del 6% en el salario semanal; (b) un aumento del 4%, mas una bonification semanal de 
$5,800 a cada obrero. ^cual de las dos altemativas mejora la situation del obrero? 

85. Dos empresas tienen ocupados 600 obreros, distribuidos asi, el 30% en A y el resto en la empresa 
B. Se sabe que el promedio de salario en esta ultima es de $860,000 y en A es del 20% menos que 
de B. ^Cual es el promedio de salarios para el total de obreros? 

86 . Se tienen dos cursos A y B, donde el primero tiene un promedio de calificacion de 3,4, mientras que 
en el B es de 4,2. Diga que porcentaje de alumnos tiene A y B, si el promedio de calificacion para 
la suma de los dos cursos es de 3,7. 



ZONA 

2001 

2011 

1 

322.867 

240.776 

2 

204.903 

267.358 

3 

345.604 

575.864 
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87. Se tiene que 


y 2 =22 

yl =50 

m = 6 

C 

= constante n 2 +n 4 =15 

n l + n 3 = 25 

n = 50 

n. + n = 10 

n , 

=8 n=2 n=7 


J o 

[ 5 2 


Se pide calcular la media armonica y cubica. 


88 . Decir si son ciertos o falsos y por que: 


a) 

X =68 

M 

e 

= 62 

M d 

= 68 


b) 

X 

II 

o 

M 

0 

= 65 

m 2 

= 72,50 M_j = 63 

M 3 = 76,8 


89. Dados los numeros 8, 12, 16, 20, encontrar la media armonica, la media geometrica, la media cubica 
y la media cuadratica. 


90. Contestar verdadero si el enunciado siempre es veridico. Si no lo es, la palabra en negrilla debera 
sustituirse por una expresion con la cual el enunciado si sea valido. 

a) A un grupo de valores se le puede calcular mas de un promedio. 

b) Un grupo de valores puede tener mas de una media aritmetica. 

c) La media cubica es la raiz enesima del producto de los valores de la variable. 

d) La suma de las desviaciones con respecto al origen de trabajo es igual a cero. 

e) En una serie sencilla (datos sin agrupar) cuando el valor de n es impar, la mediana es igual al 
valor central. 

f) La media divide a los datos de una distribucion en dos mitades: la mitad may ores y la mitad 
menores que su propio valor. 

g) La moda es el valor de la variable que mas se repite. 

91. Un industrial tiene dos fabricas, la primera con 200 trabajadores y la segunda con 300, ademas se 
sabe que en promedio el salario mensual es de $1,026,328 y que los trabajadores de la segunda 
fabrica ganan $86,400 menos que los de la primera fabrica. /,Cual es el salario promedio en cada 
fabrica? 


92. Con los siguientes datos, n = 200, con frecuencias relativas y acumuladas diferentes, ya que se trata 
de dos problemas (Ay B), se pide: 


(A) (B) 



Primero trabajar con lacolumnade las frecuencias relativas (A) y 
luego con las frecuencias absolutas acumuladas. (B) 

No/a: Son dos problemas diferentes, donde las frecuencias 
relativas no corresponden a las frecuencias absolutas acumuladas. 
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a) Calcular la media aritmetica utilizando las formulas ya conocidas. 

b) Calcular la mediana (variable continua). Obtener las marcas de clase y calcular la mediana. 

c ) Calcular el modo (aplicando la formula general y las establecidas para variables continuas). 

93. Con los datos del punto anterior se pide calcular: 

a) La media geometrica 

b) El modo mediante la aplicacion de la siguiente formula: M d = 3M e - 2M 1 

c) Las medias: armonica, cuadratica y cubica. 

94. De tres numeros se sabe que su media cubica es ^657 su media aritmetica es 7 y su mediana es 6. 
Se pide calcular los valores de esos tres numeros. 

95. Se sabe que la media aritmetica de dos numeros es igual a 5 y la media geometrica de los mismos 
es igual a 4. /,Cual es su media armonica? 

96. Con los siguientes datos sin agrupar, calcular la media cuadratica. 

X. : 8 2 6 10 2 6 8 10 2 6 


97. Hallar la media cuadratica de la siguiente distribucion 


y'i-i-y'i 

2,1-6 6,1-10 10,1-14 14,1-18 18,1-22 

E 


n i 

3 7 10 6 4 

30 

f, 


98. Con los siguientes datos, calcular el primer cuartil, tercer cuartil, sexto decil y el percentil 80 
a) Variable discreta b) Variable continua 


y,\- y 

", 

3,1 - 8 

14 

8,1 - 13 

15 

13,1 - 18 

8 

18,1 - 23 

6 

23,1 - 28 

7 

28,1 - 33 

10 

I 

60 


f, 




La posicion, en una distribucion de frecuencias, lo da el valor de la variable denominada pro- 
medio, alrededor de la cual se agrupan las frecuencias. 


A los promedios se les conoce como medidas de posicion, valor promedio o valor central. 

Para cada caso en particular se deben aplicar algunas de las medidas de posicion o de ten- 
dencia central, de tal manera que el valor represente al conjunto de datos, los cuales tendran 
algunas ventajas y desventajas en su aplicacion. 
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Hay que tener en cuenta que estas medidas o promedios, proporcionan informacion acerca de 
un conjunto, siendo una forma de describir el comportamiento de esos datos, pero no propor¬ 
cionan ninguna idea del grado de variabilidad, es decir, su verdadera o aproximada represen- 
tacion de ese conjunto observado. 

Se ha dicho en repetidas ocasiones, que los promedios aplicados a datos correspondientes a 
una muestra se les denomina estimadores y aplicados a datos de una poblacion, se les conoce 
como parametros. 

A1 tener varias clases de promedios: media, mediana, modo, etc., la cifra resultante al aplicar 
una de esas medidas puede traer confusion, ya que algunas de ellas se ajustan mas a determina- 
das situaciones que otras. Hoy por hoy, la gente utiliza mas la media aritmetica, algunos pocos 
la mediana y la moda, sin tener el cuidado de seleccionar el promedio que mejor represente el 
resumen de los datos mediante una cifra que no distorsione. 

Estos promedios utilizados solo pueden ocultar informacion, cuando no representan correc- 
tamente el conjunto de datos. En estos casos se hace necesaria la aplicacion de otras medidas 
como las de dispersion, que ayudan a una mejor interpretacion de ese valor central y que se 
veran en el capitulo siguiente. 


Reglas para el uso de los promedios 

□ Cuando la serie tenga forma de progresion geometrica, debe usarse el promedio 
geometrico. 

□ Para calcular la velocidad media debe usarse la media armonica. 

□ Cuando la distribucion sea muy asimetrica, debe considerarse la posibilidad de usar 
le mediana o el modo. 

□ Cuando la distribucion tenga forma de U o sea que pueda representarse por una 
concava de extremos iguales, debe usarse el modo. 

□ Cuando quiera darsele importancia a valores pequenos de la variable, es aconsejable 
la media geometrica. 

□ En una distribucion cuyos valores extremos no estan definidos, es aconsejable la 
mediana o el modo. 

□ Cuando haya alguna razon para pensar que el promedio aritmetico no representa muy 
bien a la distribucion, debido a que valores extremos lo afectan, o por otras razones, 
debe considerarse la posibilidad de usar la mediana o el modo. 

□ Cuando la amplitud de la distribucion no es constante, no debe usarse el modo. 

□ Cuando se requiere promediar relaciones (tasas), se debe usar la media armonica. 

□ En los demas casos debe usarse la media aritmetica. 
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ANEXOS A LA UNIDAD 3 


Se explicara brevemente el uso de la calculadora, asi como la aplicacion del programa EXCEL, con lo 
cual el lector podra agilizar los calculos correspondientes, tal como se vera a continuacion. 


APLICACIONES CON LA CALCULADORA 
■ Calculadora CASIO f - 5000 F 


□ Primero . Se oprimen las teclas 

MODE 

X 

de la pantalla, el simbolo 

SD 



□ Segundo. Se hace necesario, antes de iniciar los calculos, borrar la informacion que 
hubiese con anterioridad, mediante la ejecucion | SHIFT | |DEL| | EXE . 


□ Tercero . Se comienza con la entrada o captura de la informacion (datos). 


Ejemplo 1. Cj^sideremos los siguientes datos sin agrupar: X.: 8 10 20 3 7 Iniciamos digitando el 8 y 
luego la tecla DT identificada por dt, correspondiente a data, a continuacion se repite el proceso, pero 
ahora con 10, luego con 20 y asi sucesivamente. 

Ejemplo 2. Procedamos ahora a la entrada de los datos correspondientes a una tabla de frecuencias o 
datos agrupados, siendo n = 40 

X.: 2 4 6 8 10 
n ; : 3 6 10 12 9 


SHIFT | ^ \6\ | DATA | y asi sucesivamente 


2 

SHIFT 

TT D Luego se hara 

4 


Ya digitados los datos, la obtencion de los resultados al aplicar las formulas respectivas, tanto para el 
primero como en el segundo ejemplo, se hara de la siguiente forma: 


SHIFT! I PROG 


■ 

“21 


lx , 2 6 ly, 2 n 
lx ( . 6 £y,.n. 


Ahora con SHIFT 


3 ^ 

■ 


* CT n 


x G n - 1 


Calculadora CASIO f -30MSG 


□ Primero . Al oprimir la tecla |MODE| aparecen en pantalla tres operadores COMP SD | |REG 


■ 

oprimimos en el \2\ para obtener |SD| con el cual iniciaremos los calculos. Vale la pena indicar que 
se oprime el |T] para salir, una vez realizadas todas las operaciones. 


□ Segundo. Borramos toda la informacion que se tenga con 

SHIFT 

MODE (CLR) con el cual 

aparecen otros operadores, seleccionando el [T] correspondiente 

SCL 



□ Tercero. La entrada o captura de todos los datos, se hace igual que con la anterior calculadora. 

□ Cuarto. La salida u obtencion de los resultados se hace de la siguiente forma: 
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Con | SHIFT | [Y] se tienen tres opciones 


Con | SHIFT | \T\ hay tres opciones 


Calculadora CASIO f - 570M S 



□ Primero. A1 oprimir la tecla |MODE| aparecen en pantalla dos opciones 1 | COMP | 2 


CMPLY 


Oprimimos nuevamente |MODE| y nuevamente se nos dan otras tres opciones SD | |REG| [BASE 


Procedemos a seleccionar el [T] correspondiente a |SD 


l 2 


□ Segundo. Procedemos a capturar informacion, tal como se realizo en la primera calculadora. 
Datos sin agrupar: [8] |DT| luego [10] |DT| y asi sucesivamente. 

En datos agrupados, se procede asi: \2\ [T] [3] luego [4] [T] [6] y asi sucesivamente. 

□ Tercero. Los resultados aparecen, mediante el siguiente proceso: 

n 


Con | SHIFT | \T\ se seleccionan asi: [T] X 

Calculadora CASIO f - 3507/. 


2 

EX,. 

3 

2 


3 


x®n - 1 


Con MODE nos aparecen CD I COMP | 12 ] |SD| |31 |REG| seleccionamos la opcion CD y pro¬ 
cedemos a capturar o digitar la informacion, exactamente igual como se hizo en los procesos 
anteriores. La salida de los resultados se hara asi: 


Con SHIFT 1 se obtiene * 


Con SHIFT 2 se obtiene x a n 


Con SHIFT 3 se obtiene x o n x 


Media aritmetica 
■» Desviacion tipica 
—> Desviacion tipica corregida 


Ahora con la tecla u opcion |RCL| y las letras [AJ [CJ s e obtienen los resultados para 


RCL| A| Ex y 2 |RCL| [BJ Ex. y |RCL| C | n respectivamente. 


C l TRABAJQ EN EXCEL PARA EL CALCULQ DE LA MEDIA 

Para el calculo de la media se realiza el siguiente procedimiento: 





□ Hacemos CLIC en ANALISIS DE DATOS. Para tener acceso a estas herramientas, hacemos 
clic en ANALISIS DE DATOS en el grupo ANALISIS de la ficha DATOS (Ver aplicativos en 
Excel del Capitulo 2) 
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FiguraNo. 1. Microsoft Excel 
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□ Hacemos CLIC en el submenu ANALISIS DE DATOS. Nos aparece un cuadro de dialogo, 
en el cual seleccionamos una de las funciones, en nuestro caso la opcion identificada como 
ESTADISTICA DESCRIPTIVA. 


Figura No. 2. Funciones para analisis 


iH| y *0 - o* ] ^ 


Libro2 - Microsoft Excel 



□ Luego al hacer CLIC en ACEPTAR, debera aparecer la figura siguiente: 
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Figura No. 3. Estadistica Descriptiva 
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A1 
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A 

B C 

D 

E F 
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1 J 

K 

L 

1 ^ 


3 






Entrada 

4 





Ranao de entrada: Hfl 

5 





Agrupado por: © Columnas 

O Bias 

6 






7 






EH Rotulos en la primera fila 

8 







Estadistica 


"SB 


[ Aceptar | 


rOpciones de salida 
O Rango de salida: 

© En una hoja nueva: 

O En un [ibro nuevo 
Q Resumen de estadisticas 
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I [wlAPLICACIONESEN... 


O Microsoft Excel - L... 


ES QvJ 12:45 


□ Tabla No. 1- Los datos que se presentan a continuacion se encuentran en la segunda parte del 
SIL en internet. La tabla siguiente solo muestra una parte de los datos que contiene el SIL, por 
tanto es conveniente para el desarrollo del siguiente ejercicio tomar la totalidad de los datos, 
es decir, los 1100 datos que aparecen alii. 


Tabla No. 1. Poblacion Total de una Institucion Educativa 


No. 

Orden 

Facultad 

Sexo 

No. 

Hermanos 

No. Libros 

leldos 

Pro medio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

Estatura/Cm 

Peso/Kg 

1 

2 

1 

3 

4 

2,6 

1 

410 

18 

140 

46 

2 

2 

2 

2 

2 

4,1 

1 

360 

20 

158 

48 

11 

2 

1 

8 

5 

3,6 

1 

320 

20 

168 

65 

16 

2 

1 

0 

4 

3,8 

1 

300 

19 

166 

64 

17 

2 

1 

6 

2 

3,1 

1 

270 

21 

168 

60 

75 

3 

2 

3 

3 

3,1 

1 

280 

19 

154 

50 

147 

3 

1 

1 

8 

5 

1 

310 

17 

174 

83 

148 

2 

2 

4 

2 

4,2 

2 

310 

16 

182 

70 

149 

1 

1 

6 

3 

2,6 

1 

320 

20 

178 

88 

150 

3 

1 

2 

4 

2,8 

1 

400 

24 

165 

70 

151 

1 

2 

0 

6 

3,4 

2 

380 

20 

165 

58 

152 

1 

2 

0 

3 

2,8 

1 

310 

20 

171 

59 

153 

1 

2 

3 

5 

4,2 

2 

350 

22 

169 

64 

154 

2 

2 

4 

8 

4,1 

2 

400 

23 

172 

68 

155 

2 

1 

2 

2 

4 

2 

400 

24 

163 

72 

156 

3 

2 

6 

2 

4 

2 

380 

20 

165 

58 

157 

1 

1 

5 

2 

3,6 

2 

420 

26 

178 

88 

158 

1 

1 

6 

2 

3,2 

1 

300 

20 

182 

84 

159 

3 

2 

2 

6 

3,8 

2 

315 

19 

180 

70 

160 

1 

1 

4 

4 

4,2 

1 

310 

18 

174 

81 

276 

1 

1 

0 

2 

4 

2 

350 

19 

162 

69 

277 

1 

1 

0 

6 

3,8 

2 

320 

20 

168 

68 
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276 

1 

1 

0 

2 

4 

2 

350 

19 

162 

69 

277 

1 

1 

0 

6 

3,8 

2 

320 

20 

168 

68 

376 

2 

1 

0 

4 

3,8 

1 

300 

19 

166 

64 

377 

2 

1 

6 

2 

3,1 

1 

270 

21 

168 

60 

378 

1 

2 

3 

6 

3,9 

2 

260 

27 

165 

68 

379 

2 

2 

0 

2 

3,9 

2 

290 

26 

171 

66 

380 

3 

1 

0 

3 

4,1 

1 

380 

30 

169 

72 

381 

2 

2 

8 

7 

3,9 

2 

410 

24 

168 

70 

382 

3 

1 

0 

10 

4,4 

2 

420 

25 

180 

84 

383 

1 

1 

1 

3 

4,2 

1 

390 

22 

174 

80 

384 

2 

2 

6 

6 

4 

2 

370 

23 

166 

68 

385 

3 

1 

0 

11 

3,9 

2 

290 

24 

162 

60 

386 

3 

2 

0 

8 

3,9 

2 

300 

19 

151 

66 

387 

2 

2 

2 

2 

4 

1 

330 

18 

158 

60 

388 

1 

2 

3 

2 

3,3 

2 

310 

17 

159 

58 

399 

1 

1 

2 

2 

4,5 

1 

300 

28 

150 

56 

400 

3 

2 

0 

6 

3,6 

2 

280 

17 

148 

46 

408 

1 

1 

0 

3 

3,5 

2 

270 

17 

163 

65 

440 

1 

1 

4 

3 

2,7 

2 

320 

15 

168 

76 

441 

3 

1 

0 

3 

3 

2 

290 

17 

171 

82 

442 

3 

1 

0 

6 

3 

2 

410 

18 

174 

86 

443 

1 

1 

4 

2 

3,6 

1 

400 

19 

176 

84 

444 

2 

2 

7 

4 

3,8 

1 

380 

20 

180 

70 

445 

3 

2 

2 

2 

4,5 

2 

360 

17 

178 

69 

814 

2 

2 

3 

10 

2 

1 

280 

18 

165 

60 

815 

2 

2 

2 

8 

4,3 

2 

270 

18 

160 

61 

816 

1 

1 

0 

2 

4 

2 

350 

19 

162 

69 

817 

1 

1 

0 

6 

3,8 

2 

320 

20 

168 

68 

818 

1 

2 

2 

2 

3,6 

1 

320 

17 

174 

68 

819 

3 

1 

3 

2 

4,6 

2 

410 

16 

176 

69 

820 

2 

2 

1 

6 

1,8 

1 

240 

17 

172 

69 

821 

3 

1 

3 

5 

3,1 

2 

280 

17 

169 

76 

822 

3 

1 

8 

5 

1,9 

2 

250 

16 

164 

70 

828 

2 

2 

0 

6 

4 

2 

370 

17 

174 

69 

869 

1 

1 

6 

3 

2,6 

1 

320 

20 

178 

88 

870 

3 

1 

2 

4 

2,8 

1 

400 

24 

165 

70 

871 

1 

2 

0 

6 

3,4 

2 

380 

20 

165 

58 

997 

1 

1 

0 

6 

3,8 

2 

320 

20 

168 

68 

998 

1 

2 

2 

2 

3,6 

1 

320 

17 

174 

68 

999 

3 

1 

3 

2 

4,6 

2 

410 

16 

176 

69 

1000 

2 

2 

1 

6 

1,8 

1 

240 

17 

172 

69 

1068 

3 

2 

2 

2 

3,4 

2 

300 

26 

172 

70 

1069 

2 

1 

6 

6 

3,6 

1 

310 

21 

164 

68 

1075 

1 

2 

3 

2 

2,6 

1 

270 

15 

165 

60 

1082 

3 

2 

3 

8 

3,6 

1 

320 

32 

165 

64 

1083 

1 

1 

6 

10 

2,9 

2 

370 

30 

162 

70 

1084 

1 

2 

0 

8 

3,4 

2 

400 

28 

163 

58 

1085 

1 

2 

3 

6 

2,6 

1 

270 

15 

168 

56 

1096 

1 

2 

2 

2 

3,6 

1 

320 

17 

174 

68 

1097 

3 

1 

3 

2 

4,6 

2 

410 

16 

176 

69 


El cuadro de dialogo que se presenta en la figura No. 3. ESTADISTICA DESCRIPTIVA sera te- 
cleado con la siguiente informacion: 

□ La casilla RANGO DE ENTRADA, corresponde a la variable NUMERO DE HERMANOS, 
es decir, seleccionamos una muestra de rango D2:D406. Debemos tener en cuenta que esta 
seleccion incluye el nombre de la fila. 

□ Nuestra informacion esta agrupada por Columnas, en este caso activamos el campo 
correspondiente. 
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Figura No. 4. Estadistica Descriptiva (Pantallazo Adicional) 
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TABLA No. 1 POBLACION (1.100 ESTU PI ANTES DE UN CENTRO EDUCATIVO) 
Promedio I . , ' 


L a 

— s 


No. 

Orden 


7 _ 

8 

9 _ 

10 


No. 

Hermanos 


| 19 2 | 2 | 0 

< ► >i Hojal Hoja2 Hoja3 tJ 


Estadistica descriptiva 


mm 


Entrada 
Rango de entrada: 

Agrupado por: 

□ Rotulos en la primera fila 


© Columnas 
O Bias 


Ayuda 


I $M$3 


Opciones de salida 
© Rango de salida: 

O En una hoja nueva: 

O En un [ibro nuevo 
0 Resumen de 
0 Nivel de confianza para la media: 9 5 

0 K-esimo mayor: U _ 

0 K-esimo menor: KP_ 


m 


Estatura Cm 




Peso/Kg 


|w] Aplica en Ex,., [ [w] Aplica en Ex... ^ i§jUbrol 


_ SDE : [june s^7^e| marzo d 

[ ^NENA (G:) | Q Libro Est : 


□ Hacemos CLIC en el campo ROTULOS EN LA PRIMERA FILA, con el fin de que los 
resultados salgan clasificados. 

□ En la categoria OPCIONES DE SALIDA, podemos establecer donde queremos que nos muestre 
el cuadro de resultados. En nuestro ejemplo, activamos la opcion RANGO DE SALIDA, y 
seleccionamos la celda M3. 

□ Activamos las opciones RESUMEN DE ESTADISTICAS; NIVEL DE CONFIANZA PARA 
LA MEDIA, que para nuestro ejemplo, lo consideramos en un 95%, asi que tecleamos este 
valor. 

□ Tambien seleccionamos las opciones de K-ESIMO MAYOR Y K-ESIMO MENOR, haciendo 
CLIC en estos campos. En nuestro caso, tecleamos el numero 1 en cada campo, esto es, en caso 
de que se presente un numero mayor de resultados para el analisis. 

□ Finalmente hacemos CLIC en ACEPTAR. A1 hacer CLIC en ACEPTAR, se obtiene la 
informacion, tal como puede observarse en la figura No. 4, que sera profundizada mediante la 
aplicacion de las formulas correspondientes en los capitulos 3 y 4 de este libro. 

□ Los resultados de la figura No. 5, nos muestran un cuadro resumen con los valores de la Media, 
Error Tipico, Mediana, Asimetria, Minimo, Maximo, Suma, asi como el Conteo para la variable 
NUMERO DE HERMANOS. 
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Figura No. 5 Cuadro de Resultados 


No. Hermanos 

Media 

2,68069307 

Error tipico 

0,12714053 

Mediana 

2 

Moda 

0 

Desviacion estandar 

2,55549299 

Varianza de la muestra 

6,53054443 

Curtosis 

0,58527109 

Coeficiente de asimetria 

1,04257772 

Rango 

12 

Minimo 

0 

Maximo 

12 

Suma 

1083 

Cuenta 

404 

Mayor (1) 

12 

Menor(l) 

0 

Nivel de confianza(95,0%) 

0,24994148 


□ Nota: Para lograr los resultados en todas 
y cada una de las opciones (Resumen 
de estadisticas; nivel de confianza para 
la media, K-esimo mayor y K-esimo 
menor), deben activarse. 

Se podra calcular en forma independiente, 
cada una de las medidas denominadas de 
TENDENCIA CENTRAL y de DISPER¬ 
SION, para ello solo se va a tomar una de las 
variables, en este caso sera el NUMERO DE 
HERMANOS, de acuerdo con la informacion 
de la Tabla No. 1. El calculo de estas medidas 
se presenta a continuacion: 

□ Seleccionamos la CELDA, es decir, la 
activamos en el lugar donde deseamos 
que aparezca el resultado. 

□ Con el MOUSE nos movemos al ICONO 
fx, y hacemos CLIC dos veces. De este 
modo aparecera la figura correspondiente 
a INSERTAR FUNCION. 


Figura No. 5. Insertar Funcion 
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Devuelve la media de la porcion interior de un conjunto de valores de datos. 
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Matriz es la matriz o rango de valores que desea acotar y calcular su media. 
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Resultado de la formula = 
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Ayuda sobre esta funcion 
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Cuadro No. 1. Resultados para cada una de las variables cuando los datos estan sin agrupar 


Medidas 

No. 

Hermanos 

No. Libros 

leidos 

Promedio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

Estatura/Cm 

Peso/Kg 

Media 

2,687898089 

4,66515014 

3,489626934 

1,651501365 

316,5696087 

20,3963636 

166,9363636 

67,1172727 

Error tipico 

0,077286891 

0,08489441 

0,019766201 

0,014379939 

1,334706027 

0,12466909 

0,222495241 

0,27102907 

Mediana 

2 

4 

3,6 

2 

310 

20 

168 

66 

Moda 

0 

2 

3,6 

2 

310 

20 

168 

60 

Desviacion estandar 

2,562150779 

2,81434901 

0,655272679 

0,476711778 

44,24706493 

4,13480593 

7,379332318 

8,98901725 

Varianza de la muestra 

6,564616616 

7,92056034 

0,429382283 

0,227254119 

1957,802755 

17,0966201 

54,45454545 

80,8024311 

Curtosis 

0,67110538 

-0,30739702 

0,063374502 

-1,597435984 

-0,223624021 

0,48917427 

1,349355724 

-0,02761855 

Coeficiente de asimetria 

1,066995481 

0,75017149 

-0,27308826 

-0,636768724 

0,653420663 

1,04230999 

-0,484056991 

0,3668056 

Rango 

12 

12 

3,4 

1 

180 

18 

50 

42 

Mmimo 

0 

0 

1,6 

1 

240 

15 

140 

46 

Maximo 

12 

12 

5 

2 

420 

33 

190 

88 

Suma 

2954 

5127 

3835,1 

1815 

347910 

22436 

183630 

73829 

Cuenta 

1099 

1099 

1099 

1099 

1099 

1100 

1100 

1100 

Mayor (1) 

12 

12 

5 

2 

420 

33 

190 

88 

Menor(l) 

0 

0 

1,6 

1 

240 

15 

140 

46 

Nivel de confianza(95,0%) 

0,151646685 

0,16657361 

0,038783795 

0,028215264 

2,618862553 

0,24461632 

0,436563451 

0,53179288 


Nota. Observe cuidadosamente los errores que se pueden cometer si consideramos aquellas caracteristicas que son cualitativas, tales como FACUL- 
TAD, SEXO, TRABAJA. En estos casos el resultado no nos dice absolutamente nada, pues las medidas a aplicar, entre otras, seria la proporcion, 
para luego presentarlo como porcentajes. 
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Figura No.6. Media 
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□ En la figura No. 6, se nos pide en la primera celda la MATRIZ. Se debe ir a la Tabla No. 1 y 
sombrear todos los datos sin soltar el boton izquierdo. 

□ En la casilla que dice PORCENTAJE se le da el valor de cero (0) y se observara que el resultado 
de la MEDIA es de 2.68, siendo el mismo resultado que se obtuvo por el procedimiento anterior, 
tal como lo muestra la figura No. 7. 


Figura No. 7 Calculo de la media (numero de hermanos) 
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Nota: el procedimiento anterior es aplicado igualmente para las diferentes medidas de POSICION y de 
DISPERSION, solo cambia cuando nos ubicamos en el nombre de la funcion, es decir, la medida que 
se requiere calcular. 

En las siguientes paginas se expondra de forma general la TEORIA de ciertas medidas de posicion y 
de Tendencia Central, tales como LAMEDIANA, MODAY MEDIA GEOMETRICA, especificando en 
cada caso a traves de un ejemplo el procedimiento a seguir para obtener los resultados correspondientes 
en la hoja de calculo. De forma complementaria, al final del capitulo, se encuentra la unidad de ejercicios 
para resolver a fin de profundizar sobre estos temas. 

MEDIANA- M c 


En datos sin agrupar hay dos maneras de calcularla: 

a) Numero de Observaciones IMPAR. En este caso se ordenan los datos de menor a mayor o 
viceversa, luego seleccionamos como MEDIANA al valor central. 


Ejemplo: 


12 

T 

Me 


16 30 


b) Numero PAR de observaciones. Tambien se ordenan de mayor a menor o de menor a mayor; 
solo que en este caso se tienen dos valores en el centra, asi que debemos promediar. 


Ejemplo: 


3 5 |12 16| 30 46 

Me = (12 + 16) / 2 = 14 


FiguraNo. 8. Mediana (Pantallazo Adicional) 
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TABLA No. 1 POBLACION (1.100 ESTUDIANTES DE UN CENTRO EDUCATIVO) 
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No. 

Orden 

No. 

Hermanos 

Sexo 

No. 

Hermanos 

No. Libros 

leidos 

Promedio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

E statu raTCm 

Peso/Kg 


1 i 

3 

1 

4 




L2J 



46 


2 

2 

2 

2 

2 


Insei tai funcion 



48 


3 

4 

2 

4 

6 


Bl 

iscar una funcion: 



50 


4 

3 

2 

3 

2 


Escriba una breve description de lo que desea hacer y, a 
continuation, haga die en Ir 

( 5“ 

1 


58 

5 

6 

1 

6 

10 
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6 

8 

2 

8 
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O seleccionar urn 

s categori'a; | Estadisticas v | 
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1 
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Seleccionar una funcion: 
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1 
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MIN 

MINA 

MODA.UNO 


11 

8 

1 

8 
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12 

6 

1 

6 
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78 


13 

4 

2 

4 

3 


MEDIAN A(numero 1 ;numero2;...) 

Devuelve la mediana o el numero central de un con junto de numeros. 
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FiguraNo. 8. Mediana (Pantallazo Adicional) 
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TABLA No. 1 POBLACION (1.100 ESTU PI ANTES DE UN CENTRO EDUCATIVO) 
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No. 

2 Orden 

No. 

Hermanos 

Sexo 

No. 

Hermanos 

No. Libros 

leidos 

Promedio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edadanos 

Estatura/Cm Peso^TCg 


3 

•: vi S 

3 

1 <D3D1102) 

4 

2j6 
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410 
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140 | 46 


4 

2 

2 

2 
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Argumentos de funcion 

\3M 

48 

5 

3 

4 

2 

4 



50 


MEDIANA 

6 

4 

3 

2 

3 


58 


7 

5 

6 

1 
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8 
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Numero2 [9jj] = numen 
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9 

7 

1 

1 
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61 


10 

8 

0 

1 

0 


= 2 

Devuelve la mediana o el numero central de un conjunto de numeros. 

Numero 1: numerol;numero2;... son de 1 a 255 numeros, nombres, matrices o 
referencias que contienen numeros, para los cuales desea obtener la 
mediana. 
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76 
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65 
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78 
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Resultado de la formula = 2 
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Hojal , Hoja2 , Hoja3 , 


□ Observe, que para el calculo de la MODAy demas MEDIDAS, aparece en las primeras casillas 

la palabra NUMERO 1, es en esta donde se debe copiar el rango de los valores que aparecen en 
la Tabla No. 1 correspondiente a la columna NUMERO DE HERMANOS. Luego de establecer 
este rango es posible observar, que al compararlo con el obtenido en el anterior metodo, la 
MEDIANA sigue siendo igual a 2.0. 

Nota: Este resultado se localiza en la celda que se escoja y asi sucesivamente. No obstante 
lo anterior y para efectos de profundizar sobre estos temas, le invitamos a realizar el mismo 
procedimiento para las demas columnas de la Tabla No. 1. 

MODO = MODA = VALOR MODAL: M D 

Se define como aquel valor de la variable que mas se repite. Para algunos no es aconsejable calcularla 
mediante la utilizacion de Excel en caso de que haya mas de una MODA, es decir, que sea BIMODAL o 
PLURIMODAL. Solo se debe aplicar si es UNIMODAL, es decir, cuando hay una sola moda. En caso 
de ser BIMODAL O PLURIMODAL, solo se reconoce la primera MODA de la lista. 

Los pasos son los mismos utilizados para el calculo de la MEDIA y la MEDIANA, esto es: (Figura No. 

9). 


Nota: El resultado de una MODA = 0 nos indica que cero es el valor que mas se repite en la muestra. 
Observese que el resultado anterior, es el mismo al obtenido en el cuadro No. 5. 
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Figura No.9. Moda 
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MEDIA GEOMETRICA : M = M _ 

U U 

Se define como la “raiz enesima del producto de los valores de la variable. 


Formula M o = \X y X 2 . X n 


M = V n X. 

0 v ;=\ 1 


Figura No. 10. Estimacion Moda (numero de hermanos) 
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TABLA No. 1 POBLACION (1.100 ESTUDIANTES DE UN CENTRO EDUCATIVO) 


No. 

2 Orden 

No. 

Hermanos 

Sexo 

No. 

Hermanos 

No. Libros 

leidos 

Promedio 

calificacion 

matematicas 

Actualmente 
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Calificaciones 

ICFES 
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Devuelve la mediana o el numero central de un con junto de numeros. 

Numero 1: numero 1; numero2;... son de 1 a 255 numeros, nombres, matrices o 
referencias que contienen numeros, para los cuales desea obtener la 
mediana. 
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Resultado de la Formula = 2 
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□ Nuevamente se siguen los mismos pasos aplicados para calcular la MEDIA, MEDIANA Y 
MODA. Hacemos CLIC en fx y seleccionamos CATEGORIA ESTADISTICA, luego, a la 
derecha elegimos la funcion MEDIA GEOMETRIC A, finalmente hacemos CLIC en ACEPTAR. 


MEDIA ARITMETICA PONDERADA 


Para utilizar Excel en el calculo de la MEDIA PONDERADA, se realiza el siguiente procedimiento: 

□ Tomemos ahora la tabla que aparece a continuacion, correspondiente a la variable (y^: Edad 
(anos); y su frecuencia absoluta, siendo (fl.) el numero de veces que se repite cada valor de la 
variable. Para ello vamos a tener presente una tabla de datos agrupados, aplicando la formula 
que debera ser digitada: 

=SUMA PRODUCTO (A2:A9;B2:B9)/SUMA(B2:B9) 


Figura No. 11. Media Aritmetica Ponderada 
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de dispersion, 
de deformation 
y apuntamiento 

E studia no para saber algo mas sino para 
saberlo mejor. Ya que el saber mas que los 
otros es facil. Lo dificil es saber algo mejor 

que los otros 




k J IKM mx 

k / 

CONTENIDO 

Aplicaciones practicas de las medidas de Dispersion 
o de deformacion, Asimetria y de Apuntamiento. 

■ 

Definiciones, formulas, propiedades y apli¬ 
caciones. 

■ 

Medidas de dispersion: Varianza, Desvia- 
cion tipica, Coeficiente de variacion, Pun- 
taje tipico, Rango o recorrido. 

■ 

Medidas de asimetria. 

■ 

Medidas de apuntamiento. 

■ 

Sintesis de la unidad. 

■ 

Ejercicios para Resolver, resueltos en el 

Sistema de 1 nformacion en L mea SI L. 

COM PETENCIAS 

El estudiante debera estar en capacidad de: 

□ 

Seleccionar, comprender y aplicar cada 
una de las medidas, en casos que lo 

□ 

d-IllCllLCii. 

Manejar los conceptos, formulas, usos 
e importancia que cada una de estas 
medidas lo exige, no solo en los talleres, 
sino en casos reales. 

□ 

Comprender sus aplicaciones y agilizar 
sus calculos. 

□ 

Entender los conceptos, las ventajas y 
desventajas en su aplicacion. 
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CONCEPTOSGENERALES 


Estos primeros cuatro capitulos han sido dedicados a la estadistica descriptiva. Comenzamos con el 
manejo de terminos y conceptos, luego, el uso de la simbologia para hablar un mismo lenguaje, lo cual 
nos permitio la elaboracion de cuadros y graficas; luego la aplicacion de promedios y ahora, el calculo 
de las medidas de dispersion , que sera el tema de este capitulo. 

A1 calcular un promedio, por ejemplo la media aritmetica, no sabemos hasta donde se da la repre- 
sentatividad para ese conjunto de datos, sin embargo es posible determinar si hay concentracion de datos 
alrededor del promedio, el cual nos indicaria una buena aplicacion, por el contrario una gran dispersion 
estaria indicando poca representatividad, por lo tanto no seria confiable o adecuada para el conjunto de 
datos. Aun mas, las medidas de dispersion son indicadas cuando queremos evaluar dos o mas promedios. 
Para este capitulo el estudiante tiene la necesidad de repasar los contenidos del capitulo 3. 

MEDIDAS DE DISPERSION 


Supongamos que dos distribuciones de edades tienen igual media, pero diferentes grados de dispersion, 
por lo tanto hace que una de ellas sea mas representativa o mas confiable. 

25 anos 

A 


Xrmn=20 (A) Xmax=32 M&s comfiable 


Xmin=5— 4 -(B)- ►.Xmax=60 Menos comfiable 

Observe que 32 - 20 = 12, y 60 - 5 = 55, por lo tanto 12 < 55 permite decir, que hay menos varia- 
bilidad en el primer caso; lo cual hace que el promedio de 25 anos de edad sea mucho mas representativo. 

VARIANZA : S 2 6 o 2 

Las medidas de dispersion mas conocidas y utilizadas son la varianza y la desviacion tipica 0 estandar. 
Esta ultima, es la raiz cuadrada de aquella. 

La varianza se define como: la media aritmetica de los cuadrados de las diferencias (desviaciones) 
entre los vatores que toma la variable y su media aritmetica. Su simbolo es S2 en la muestra, o2 (sigma 
al cuadrado) en la poblacion. 
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ato 

a 

a 




i) 

S 2 = 

Z{x-xf 

n 

(muestra); 

r 

a 2 = 

z(V ) 2 

N 1 

2) 

C2 - 

1.x 2 -nx 2 


rr 2 - 

I,X j 2 - N 2 1 

J — 

n 


o — 

N | 

3) 

S 2 = 

Ex 2 

— 1 - X 2 

n 


I rr 2 - 

IX. 2 

I 2 

l 

o — 

L _ 

N 1 


Veamos con un ejercicio como se aplican las formulas anteriormente presentadas, obteniendose un 
resultado igual a la aplicacion en cada uno de ellos. 

E jemplo 1. Con los siguientes datos (sin agrupar) calcule la varianza por los diferentes metodos 


X 

II 

JX 

II 

x 3 = 1 x 4 = 6 

S2 _ V*,.-x ) 2 

r 

, Ed 2 

S 2 = ' 

n 

n 


x — $ + 3 + 1 + 6 +10 _ 25 _ r 
~ 5 

2 _ (5 — 5) 2 +(3 — 5) 2 +(l — 5) 2 + (6 — 5) 2 +(10 - 5) 2 

5 

o2 _ 0 + 4 + 16 + 1+25 _ 46 _«'■> 

‘ S " 5 "5 ’ 


Tambien se podra calcular asi: 


2) 

o2_ ~nx 2 

3) 

S 2 = 1X ‘ -x 2 


n 


n 


Hx, 2 = 5 2 + 3 2 + l 2 + 6 2 +10 2 = 25 + 9 + 1 + 36 + 100 = 171 

o2 _I71-5(5) 2 _ 171 —125 _46 
” 5 “ 5 

171 

S 2 =— —5 2 = 34,2 - 25 = 9,2 

Procedimiento decalculo 

□ Se calcula la media aritmetica, por cualquiera de los procedimientos que han visto. 

□ En la primera formula, se establecen las diferencias entre los valores de la variable con respecto a su 
media y luego se elevan al cuadrado: (X l - x) 2 + (x 2 - X) 2 + (X 3 - x) 2 y asi sucesivamente. 

□ Para la segunda y tercera formula se calcula la Ex ; 2 , se debe tener presente que corresponde a 
la suma de X 2 + X 2 2 + X 3 2 y asi sucesivamente. 
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ato a a o 

Las formulas son casi iguales a las anteriores, salvo que los valores estan ponderados, es decir, 
multiplicados por las frecuencias absolutas o las relativas. 


i) s 2 = 


SQs -it ", 


2 ) 


f JLy; n, -ny 1 


,2 


3) s =—^—‘-—y 


S2= Z(Xr-X]£ 


} I X,f-nX- 
S 2 = -—- 


s-=HLL-x- 


E jemplo 2. Calculemos la varianza para la siguiente distribucion, aplicando las tres formulas anteriores. 
Siendo el procedimiento igual tanto al trabajar con variable discreta o continua. 


y, 

n 

y n 

y, ~y 

(y-y)n 

(y-yfn, 

* 2 

yt ", 

5 

2 

10 

-9,75 

-19,50 

190,1250 

25 

50 

10 

4 

40 

-4,75 

-19,00 

90,2500 

100 

400 

15 

8 

120 

0,25 

2,00 

0,5000 

225 

1.800 

20 

5 

100 

5,25 

26,25 

137,8125 

400 

2.000 

25 

1 

25 

10,25 

10,25 

105,0625 

625 

625 

I 

20 

295 

— 

0 

523,7500 

— 

4.875 

X 

7 

X f 

d 

d f 

i J i 

d 2 f 

X] 

x; f 


n 


295 

- uj5 


X = i£i 
n 


i) 


2 _ S(j,- 7 ) 2 n, _ 523,75 _ 
n 2 


26,1875 


r 

\S 

L 

r 


2_MA 




2 _ _ 4.875 - 20 (14,75) 2 _ lg?5 j 2 _ SX 2 /, - »I 2 ~ ] 

’ n 20 ,_«_ 


3 ) ^2 = 1 37 _ jj2 = MZ5 _ 14 j 5 2 = 26,1875 

72 20 


I “ 

I 9 EX 2 /* - 9 

| ^>2 — l J l _ 

L _ 


Hay dos formulas mas, conocidas como metodos dbreviddos , utilizando las desviaciones con res- 
pecto a un valor arbitrario (cualquier valor que usted escoja) que no seran presentados y por lo tanto 
desarrollados. 

Se pudo observar en el ejercicio anterior que en el calculo de la varianza , utilizando las diferentes 
formulas, producen el mismo resultado cuando son aplicadas en un mismo conjunto de observaciones. 
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Propiedades de la varianza 


□ 

□ 


a: La varianza debe ser siempre un valor positivo. S 2 > 0. 
a\ La varianza de una constante es igual a 0. 

2 = 0 


V =M, 


-MW]' 


= M, 


a: La varianza de una constante mas una variable, es igual a la varianza de la variable. 


\I 


[y+ 


= 1 / + 1 / = 1 / 
[y] [ ] [y] 


V =\/ +\/ =\/ 

[*+ ] M U M 


1 / = 1 / ■ 

[x- ] M 


V r , =1/,. 


Valido tambien para la diferencia: .. , . , v , . r , . ryl 

Y x \ l x \ L J L X J 

a ta: La varianza de una constante por una variable, es igual al producto de la constante 
al cuadrado por la varianza de la variable. 

' / [y] = * 2 ' / [y]=* 252 y 

ta: Para el calculo de la varianza en una muestra, cuando se esta trabajando con 
submuestras, se aplica la siguiente formula: 


^ 2 n + s 2 2 n 2 +... (x r x) 2 n 1 + (x 2 -x) 2 n : 


1 1 




n+n 2 +... 


sabiendo que: 


-+ 


x = 


n+n 2 +... 

X i n i + X 2 n 2 + - 

n 1+ n 2 +... 


E jercicios de aplicacion de las propiedades 


Ejemplo 4. Primers propiedad : supongamos que se tienen dos distribuciones Ay B y se desea aplicar la 
formula de la varianza en ambos casos. 


x ( . : 

8 

2 

10 

6 

4 

X = 6 


y, ■ 

0 

1 

2 

3 

4 

vo 

II 

l^s 

n < ■ 

4 

6 

5 

3 

2 

= 20 


Las varianzas seran: 

a) S 2 = = g 
n 5 

b $2= Zy^j-ny. 2 = 85-_20(1,_6_5) 2 _ _ 
n 20 


r 


S 2 = 


Zx 2 -nx : 


n 


1,527 = 1,53 


Observemos que en ambos casos se cumple la primera propiedad, la varianza de una variable siempre 
sera mayor a cero (S 2 > 0). Por lo tanto siempre sera positiva. 


E j emplo 5. La segunda propiedad, no requiere que se hagaun ejercicio de aplicacion, pues si consideramos 
que en un curso el profesor califica un trabajo o taller con 4 para todos los alumnos, el promedio sera de 
cuatro y la varianza sera igual a cero, pues ninguna nota sera superior o inferior a cuatro es decir, no hay 
variacion. 


Ejemplo 6. Tercera propiedad: consideremos que las dos variables del ejemplo 4 estan dadas en la 
misma unidad de medida, por ejemplo en kilogramos, y se requiere que el resultado se de en libras 
(aproximadamente 2 libras por kg); para ello se tendra que: 


X i ■ 


16 


4 20 12 8 


x= 12 libras y 


S 2 = 32 libras 2 
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321ibrasJ 

5 


V .= 2 S 2 = 2 2 (8) = 32 libras 2 


+y] 


Algo similar ocurre al trabajar con datos agrupados. Observe que el resultado obtenido, siempre 
sera expresado en las mismas unidades, pero al cuadrado. 

Con los datos del ejemplo 4-b se haran los calculos 


y t 

n , 

y< n < 

y 2 ^ 

0 

4 

0 

0 

2 

6 

12 

24 

4 

5 

20 

80 

6 

3 

18 

108 

8 

2 

16 

128 

E 

20 

66 

340 

+ 

fi 

x,f, 

X 2 f 

l J f- 


zy? n , - n y 2 


,2 = 340-20(3,3)- = 


20 


- 66 ~ ~ 
>' = 20= V 


\X-*S*L\ 

I_«_ J 


V[kx] = K 2 S 2 = 2 : (1,527) = 6,11 


Ejemplo 7. Cuarta propiedad: siprocedemosasumarleunadeterminadacantidadacadavalorobservado, 
por ejemplo 5, se tendra que X. : 13 7 15 11 9 (ver ejemplo 4-a) 

La media sera: X = 11 y la varianza = 8 


V r 


— S + Vrp'1 —8 + 0 — 8 


[X+K] — ° ^ v [K] 

Se podra comprobar aplicando la formula: S z = 


2 _ 645 - 5(11) 


= 8 


= 0 


En datos agrupados al aplicar la cuartd propiedad, se tendra que: 


y< 

n , 

0 

4 

1 

6 

2 

5 

3 

3 

4 

2 

S 

20 


y> 

n , 

y t n i 

yf n , 


5 

4 

20 

100 

II 

K 

6 

6 

36 

216 


7 

5 

35 

245 

M {y+K ] - 

8 

3 

24 

192 


9 

2 

18 

162 

0 2 915 

E 

20 

133 

915 

s =- 

V 

f, 

x,f, 

x 2 f, 



133 

20 


20 


1,527 = 1,53 


Ejemplo 8. Quinta propiedad: finalmente consideramos que las dos variables o las dos distribuciones 
anteriores (a y b) corresponden a dos submuestras, siendo los resultados para cada submuestras los 
siguientes: 


«.= 5 


n 2 = 20 


X j = 6 


X= 1,65 


Sj 2 = 8 


S ? 2 = 1,53 


Se quiere calcular la media y la varianza para el conjunto de las 25 observaciones, aplicando la 

quinta propiedad. 


Xj n l + x 2 n 2 


- = 6(5) + 1,65(20) 


25 
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o2 _ S 2 + S 2 n 2 ( (jq - xf n x + (x 2 - xf n 2 
S — + 


n n 


, 2 _ (5)8 + 1,53(20) (6 - 2,52) 2 5 + (1,65 - 2,52) 2 20 

25 + 25 



= 2,824 + 3,027 = 5,851 


DESVIACION TIPICA: S y o 


La desviacion tipica es la raiz cuadrada de la varianza, considerada siempre con signo positivo. Es la 
medida de dispersion mas extensamente aplicada. 


y = +V7 S = +V 26,19 =5,12 


La desviacion tipica o estandar sera la medida que mas se va a utilizar de aqui en adelante, no solo 
en este capitulo, sino en todos los siguientes de este libro. 


La varianza se expresa siempre en unidades diferentes a las originales, es decir, si la 
variable se refiere al peso en kg, al calcular la varianza el resultado obtenido estara dado en 
kg al cuadrado, sucediendo exactamente igual con cualquiera de las unidades de medidas 
que utilicemos. Esta es la razon por la cual siempre estamos utilizando la desviacion 
tipica 0 desviacion estandar , pues el resultado se expresa en las mismas unidades de la 
variable. 


Supongamos que se tiene una poblacion normalmente distribuida, con media: 


jli = 30 G 2 = 15 y a = 3,87 


De acuerdo con la desigualdad de Tchebycheff, puede deducirse para cualquier distribucion normal 
o simetrica que la media aritmetica es mas o menos.... 


Si se toma una sola vez la desviacion tipica al lado y lado de la media, el intervalo obtenido, incluye 
el 68,3% de las observaciones. 


ju± la 



68,3 



86,6 



5,5 


JU± 3(7 
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En los proximos capitulos 7 y 8 se ampliaran estos conceptos de limites de confianza y, cual es su 
aplicacion y significado. 


Graficamente para una distribucion normal, teniendo en cuenta que la media aritmetica , la mediana 
y el modo son iguales, corresponderan al valor central de la distribucion 




[ APLICACIONES DEL EXCEL 

Varianza (aplicada a la mue5tra) S 2 = o 2 

El procedimiento es exactamente igual a los aplicados para calcular: Media, M ediana, M oda y M edia 
G eometrica. Seleccionamos el renglon correspondiente a la funcion VAR, de acuerdo a la figura No. 1. 
Luego establecemos el rango separado por dos puntos pertenecientes a la variable NUMERO DE HER- 
MANOS y hacemos CLIC en ACEPTAR 

□ Observemos que el valor de la varianza por este metodo es el mismo obtenido por el anterior 
metodo de calculo. 

Nota: En Excel 2010 es posible encontrar nuevas funciones de varianza. Si los datos representan 
la poblacion total se utiliza la funcion VARP y si por el contrario solo se toma una muestra de 
la poblacion total, se utiliza la funcion VARM. En este caso aplicamos VARM. 
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Figura No. 1. Argumentos para una Varianza 


®l a *9 - c -1- 


borrador 82 - Microsoft Excel 


^ S3 



Desviacion tfpica estandar = a 

Se define como la Raiz cuadrada de la Varianza: S = VS 2 , siguiendo el mismo procedimiento que 
hemos venido utilizando, pero esta vez, buscamos la funcion DESVEST y de esta manera se obtienen 
los resultados siguientes: 


Figura No. 2. Calculo Desviacion Tipica 



OS borrador 82 
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A1 observar este resultado se ve claramente que es la raiz cuadrada de la varianza, es decir que 

S = V6,558 = 2,56 

Nota: Todas las medidas que aparecen en la columna NOMBRE DE LA FUNCION podran calcu¬ 
late de la mism que las anteriores. 


En E xcel 2010 es posible encontrar nuevas funciones de desviacion estandar. Si los datos represen- 
tan la poblacion total se utiliza la funcion DESVESTP y si por el contrario solo se toma una muestra de 
la poblacion total se utiliza la funcion DESVESTM. En este caso aplicamos DESVESTM. 


( 

USO DE LACALCULADORA 


"\ 


El calculo de la desviacion tipica por medio del uso de la calculadora, se sigue el mismo procedimiento 
que se indico para el calculo de E X. E X ; 2 n y X (ver pagina 130). Se debe calcular la desviacion 
tipica para las poblaciones o en muestras (H > 30) ver la tecla 2, donde generalmente aparece indicado 
x G n que corresponde a desviacion tipica sin corregir. 


En algunas, el valor de G se obtiene oprimiendo 


SHIFT 

2 

; en otras calculadoras sera: 

SHIFT 


\2\ | OPPONENT 


y seleccione la opcion deseada y ese resultado obtenido al ser elevado al cuadrado 
.2 


corresponde al valor de la varianza G 


EJERCICIQS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 


1. En una distribucion unidimensional se sabe, que la media aritmetica es igual a 3,04 y que la media 
cuadratica es igual a 4,26. Se pide calcular la varianza y la desviacion tipica de dicha distribucion. 

2. En la seccion financiera de un diario se publico recientemente la (distribucion unidimensional de 
variable discreta) tabla adjunta y decia el texto del articulo, que la media aritmetica era igual a 120 
y la varianza igual a 25. 

Desgraciadamente la publicacion aparecio con dos manchas de tinta caidas en las columnas de las 
frecuencias absolutas, lo cual impidio comprobar directamente lo que en el articulo se decia. Sin 
embargo, se le pregunta ahora a usted, ^pueden aceptarse dichos valores de la media y la varianza, 
teniendo en cuenta lo que puede verse en la tabla? Conteste si puede ser posible o no y porque. 



105 

110 

115 

120 

125 

130 

135 

140 

n- 


37 

90 

95 

85 

60 




3. Con la siguiente ecuacion: 

\/[i/sx - 8] sa biendo que S x = 8. Calcular la varianza de y r 

4. Con los siguientes datos: 

y = 1/ 4 (8x - 2) x = 4 S = 2 Se pide calcular: 1/ y M ryi 

5. Una muestra de 70 datos da para una cierta variable una media de 120 y una desviacion tipica de 
6, otra semejante, pero de 30 observaciones, da para la misma variable una media de 125 y una 
desviacion tipica de 5. Si se reunen las dos muestras formando una sola de 100 datos, ^cual sera su 
media y su desviacion tipica? 
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6. Durante un periodo de 3 anos, los precios de un producto fueron en promedio de $8,000, con una 
desviacion tipica de $120. En el periodo anterior de 3 anos, el promedio fue de $5,000 con una 
varianza de $3,600. ^En que periodo hubo mayor estabilidad? 

7. La varianza de dos numeros es 1 y su media aritmetica 8. Calcular esos dos numeros. 

8. Si un conjunto de fl valores de X j se sabe que: = 10 Z X 2 = 260 S 2 = 25. Se pide encontrar 

el valor de fl. 

9. La media de 10 observaciones es 3 y la suma de sus cuadrados es 100. Encontrar la desviacion 
estandar del conjunto. 

10. Sumando 4 a cada uno de los numeros de la serie 2 6 5 9 1, se obtiene la serie 6 10 9 13 5. 
Comprobar que ambas series tienen la misma varianza y distintas medias. 

11. Hallar la desviacion tipica de dos numeros cuya media aritmetica es 9,0 y su media geometrica es 7,2. 

12. Tres profesores de estadistica registraron una calificacion media en sus examenes de 71 78 89 

con desviaciones tipicas de 9 8 7; sus clases estaban formadas por 30 25 y 15 estudiantes 
respectivamente. Determinar la calificacion media y la desviacion tipica para el conjunto de los 70 
estudiantes. ^Cuales serian estas medidas, si todos los cursos tienen el mismo numero de estudiantes? 

13. La distribucion por edades de los inmigrantes extranjeros que en el mes de Abril de 2011 arribaron 
a un pais X por via maritima fueron: 


EDAD (ANOS): 

0-10 

10,1-20 

20,1-30 

30,1-40 

40,1-50 

50,1 - 60 

60,1-70 

70,1 - 80 80,1 - 90 

PASAJEROS: 

640 

684 

863 

876 

753 

663 

414 

154 13 


a) Calcule el coeficiente de variacion de la distribucion. 


b) Aumente en 15 anos todas las edades y calcule el coeficiente de variacion <^Que opina al respecto? 

c) Fijar los limites de confianza para la V obtenida en el punto (a), siendo las posibilidades del 
86,64% y 98,76%. 

14. Enun conjunto de fl valores deX, se sabe £x 2 = 1.360 ZX, = 40 y flS 2 = 1.280. Se pide encontrar fl. 

15. Se toman las medidas de 80 personas las que tienen una estatura media de 170 cmts y una varianza 
de 7,4 cmts. Posteriormente se verified que el metro usado en la medicion tenia 9 cmts menos. Se 
pide rectificar los estadigrafos mencionados. 

16. Dada una serie de valores de X: 3, 2, 8, 1, comprobar que siendo y = 2X + 5, la media de la serie 
( ) es y = 2x + 5 y su varianza: 5 y 2 = 4 S x 2 

17. Responda a los siguientes puntos senalando si es cierto o falso. 

a) En una distribucion simetrica la desviacion media es igual a 0,7979 S. 

b) Si se multiplica la distribucion por una constante, el coeficiente de variacion se altera. 

c) La desviacion mediana es menor o igual a la desviacion media, a su vez, es menor que la 
desviacion tipica 
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18. Un profesor de educacion fisica informa, que el peso promedio de un grupo de alumnos que 
conforman el equipo de futbol es de 56 kilos y que su desviacion tipica es de 7 cmts. ^Es correcto? 
^cual deberia ser el coeficiente de variacion? 

19. Si se tienen dos distribuciones A y B en el primero S 2 = 16 y en la segunda S 2 = 25, ambos se dan 
en la misma unidad de medida. ^En cual de ellas hay una mayor variabilidad absoluta? 

20. Si las dos varianzas del ejercicio anterior se dieran en unidades de medidas diferentes, ^cual de ellas 
tienen mayor variabilidad absoluta? Si no se puede responder ^que medida de dispersion utilizaria 
usted? 

21. Si en una distribucion se tiene que la varianza calculada es de 4 horas ^cual seria la varianza de esa 
misma distribucion, pero en minutos? 

22. Con los siguientes datos obtenidos en dos distribuciones, con datos en las mismas unidades de 
medida, ^cual sera la desviacion tipica para el conjunto A + B? 

s A 2 = 28,2 s e 2 = 14,6 y A = 12 y B =9 n A = 20 n B = 30 

23. ^Es posible que una varianza sea negativa? ^Por que? 

VARIACION ABSOLUTA 


Dos o mas varianzas y dos o mas desviaciones tipicas se pueden comparar entre si, 
si las variables estan dadas en las mismas unidades de medidas, en caso contrario, 
se debera utilizar el coeficiente de variacion. 


COEFICIENTE DE VARIACION CV 


Mas conocido como variacion relativa. En ocasiones nos interesa comparar la variabilidad de dos series 
de datos, sin embargo podemos encontrar, al hacerlo, que ambas series estan expresadas en diferentes 
unidades de medidas, por lo tanto no se podran comparar sus varianzas o sus desviaciones tipicas. Puede 
darse el caso de que esten expresadas en la misma unidad, pero nos interesa determinar la variacion 
respecto a una base. Para resolver los anteriores problemas se usa el coeficiente de variacion. Si es 
multiplicado por 100, el resultado se dara en terminos porcentuales. 



(relativo) 


CV = d= -f- 100 

A 


(porcentual) 


De acuerdo a la formula anterior, es el cociente entre la desviacion tipica estandar y su media 
aritmetica , como en ocasiones se expresa en porcentajes, por esa razon aparece multiplicado por 
100. Fue propuesto por Karl Pearson (1895) con el proposito de comparar la variabilidad entre varias 
distribuciones de frecuencias. 


S = 5,12 
x = 14,75 


CV = d= 100 = 34,71% 


La aplicacion de esta formula presenta el inconveniente de que varia para distribuciones que 
tienen diferentes medias aritmeticas e igual varianza, es decir, que con igual dispersion tienen diferentes 
coeficientes de variacion. 
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E jemplo 1. Si consideramos dos distribuciones cuyas medias aritmeticas son: 

X x = 24,5 y X 2 = 30, ademas sus desviaciones tipicas o estandar son identicas, S 1 = 2 y S 2 = 2, esto nos 
indica que tienen la misma variacion absoluta, sin embargo al calcular los coeficientes de variacion, 
encontramos que presentan diferente variacion relativa a pesar de tener la misma desviacion. 

Cl/, =£/, = I 1 =-|- = 0,0816 = 8,16% CV = d=4=4 = 0,0666 = 6,66% 

1 1 X 1 24,5 2 2 x 2 30 

E jemplo 2. Para la media y la varianza de un conjunto se han hallado, respectivamente, los valores 4 y 
25. ^Que opinion merece la media aritmetica? 


CV = d= 4 = 1,25 = 125% 

4 

Esta media aritmetica no es lo suficientemente representativa de la distribucion, debido a la 
variabilidad tan alta que presenta. 


o 


C1/ = d=-H 100 
x 


E jemplo 3. Multiplicand© por 4 cada uno de los valores de la variable X. : 3 2 0 5 se obtiene la serie 
X:. 12 8 0 20. Comprobar que ambas series tienen el mismo coeficiente de variacion. 


o 


% 

400 


16(x 2 ) 

3 

12 

9 

144 

2 

8 

4 

64 

0 

0 

0 

0 

5 

20 

25 

400 

10 

40 

38 

608 


x - — -25 


%2 — —~ r ~ ~10 

2 4 


M kx = 4(2,5) = 10 =x 2 


Sj 2 = ^ ^ - 2,5 2 Si = 9,5 - 6,25 = 3,25 .S, = 25 = 1,80 

V[kx] = K V[4x] = 16 (3,25) = 52 

-1° 2 =152-100 = 52 V [4X] = 52 S 2 = 7,21 


CVi = ^ = 0,72 = 72% CV 2 = 2^ = 0,72 = 72% C V X = CV 2 

PUNTAJ E TIPICO 0 ESTANDARIZADO: Z 6 "t 


Este estadigrafo de dispersion, muy utilizado en la distribucion normal y en el analisis del coeficiente 
de correlacion, mide la desviacion de una observation con respecto a la media aritmetica en unidades 
de desviacion tipica , determinando la posicion de una observacion dada, dentro de un conjunto de 
observaciones. 
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El puntaje tipico sirve para comparar dos o mas datos individuales, aunque pertenezcan a 
distribuciones diferentes, aun en casos en que la media y/o varianza no coincidan. 

Tanto el puntaje “t” o “Z” es muy utilizado en las pruebas educacionales y psicologicas, aunque hoy 
en dia es muy frecuente en otros tipos de experimentos. 

E jemplo 1 Supongamos que una persona presenta examenes de admision para la Facultad de Economia, 
en dos universidades de San Jose. En la primera obtuvo una calificacion de 85 y en la segunda de 60, 
ademas se sabe que el promedio de calificacion para el ingreso de la universidad A es de 90, con una 
desviacion estandar de 10, en cambio en la universidad B es de 55, con una desviacion estandar de 12. Se 
desea saber en cual de las universidades esta persona se desempeno relativamente mejor? 


Z 


A 


85 - 90 _ -5 
10 “ 10 


-0,50 




60-55 

12 


12 


= 0,42 


Lo anterior indica, que el estudiante se desempeno mejor en la universidad B, donde logro 0,42 de 
desviacion estandar por encima del promedio, en cambio, en B fue de - 0,50 por debajo del promedio. 

En una distribution normal la media de la variable Z vale 0 ysu varianza es igual a 1. El puntaje tipico 
estandarizado va a ser utilizado en gran medida en el Capitulo 6 , correspondiente a la Distribucion Normal. 

E jemplo 2. En un examen final de estadistica, la puntuacion media de un grupo de 150 estudiantes fue 
de 78 y la varianza 64. En algebra, sin embargo, la media final del grupo fue 73 y la desviacion tipica 
7,6. En que asignatura hubo mayor. 

a) Dispersion absoluta b) Dispersion relativa 

c) Si el estudiante consiguio una nota de 75 en estadistica y 70 en algebra ^En que asignatura fue 
su puntuacion relativa superior? 


a) Dispersion absoluta: 


S 2 = 64 


*1 = 8 


S/ = 57,76 


S 2 = 7,6 


En estadistica hubo una mayor dispersion absoluta: S x > S 2 8 > 7,6 


b) Dispersion relativa 

CV, = -£r =0,1025 CV { =10,25% 

7o 

CV 2 =jj = 0,1041 CV 2 =10,41% 

En algebra hubo una mayor dispersion relativa: 


cv 2 >cv l 


10,41% > 10,25% 


c) Puntuacion relativa: 


Z = 


x-x 


Z = 75 - 78 =— = -q 37 
Z| 8 8 ’ 

71 -73 _ -2 _ n _, 
Zl ~ Z6 _ Z6 0,26 


Z,>Z, 


Su puntuacion relativa fue superior en algebra, dado que - 0,26 > - 0,37 
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DESVIACION MEDIA: a 

Es otro estadigrafo de dispersion de menor importancia, en relacion a la varianza y la desviacion tipica. 
Se define como la media de las desviaciones respecto a la media aritmetica , tomadas en valor absoluto. 

(Datos no agmpados) 

(Datos agrupados) 



r -■ -- 

Z 

\x t - X 

l_=KI 

u — 

a 

N 

N 

— —■ — 

z| 

n _ i 

\ 

! i 

1 *T 

f, W\f, 

U — 

a 

N 

N 


E jemplo 1. Con los siguientes datos no agmpados, calcular la desviacion media: 
x l = 5 x 2 = 3 x 3 = 1 x 4 =6 x 5 =10 




z| 

n — 1 

| X i ~ X 


Li 

n 


=2.4 



E jemplo 2. Con los datos agmpados, que se presentan a continuacion, calcular la Desviacion Media. 


El procedimiento de calculo para datos agmpados es el siguiente: 


y, 

n, 

y,-y 

\y.~y\ 


5 

2 

-9,75 

9,75 

19,50 

10 

4 

-4,75 

4,75 

19,00 

15 

8 

0,25 

0,25 

2,00 

20 

5 

5,25 

5,25 

26,25 

25 

0 

10,25 

10,25 

10,25 

Z 

20 

— 

— 

77,00 

Xi f, d, 

Ml 

H\f. 


y =14,75i=Jfi 

* i_i 



Do = § =3,85 


D„ = 


Ad,\f, 


En una distribucion Simetrica o Normal, la Desviacion Media es igual al producto de 
0,7979 por la desviacion tipica. 

D a = 0,7979 S 
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En el ejercicio anterior tenemos una desviacion tipica de 5,12, por lo tanto la Desviacion media sera 
igual a: D= 0,7979 (5,12) = 4,09 
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Dado que la distribucion anterior no es si metrics, presenta el resultado obtenido alguna diferencia; 
sin embargo, vemos que la relacion se cumple aproximadamente, por ser la distribucion ligeramente 
asi metrics. 

La desviacidn media se usa muy poco; en el caso de ser calculada en una distribucion de frecuencias 
sera necesario suponer que la media aritmetica representa adecuadamente a los valores de la variable. 

El valor obtenido al calcular la desviacidn media siempre sera menor al de la desviacion tipica 

I D <S I 

_ a _ 


COEFICIENTE DE DESVIACION MEDIA : 


Esta medida de dispersion es muy parecida en su presentacion y calculo al Coeficiente de variation , con 
la diferencia de considerar a la Desviacidn media (Da) en vez de la Desviacion tipica (S). Tambien se 
puede expresar en terminos porcentuales. 

Ejemplo 1 . De acuerdo a los datos de dos ejemplos anteriores (desviacion media) se pide aplicar esta 
medida de dispersion: 


o 


Ejemplol: 


Ejemplo 2: 


CD = “z~ 100 = —— = 0,48 O 48% (en datos no agrupados) 

X 5 

CD a = -jr 100 — — 0,1925 = 19,25% (en datos agrupados) 


DESVIACION MEDIANA : 


Corresponde a los denominados estadigrafos o medidas de dispersion, siendo su uso mas bien limitado. 
Se define como la M edia de los valores absolutos de las diferencias entre los valores que toma la variable 
y su mediana. 

Sus formulas son: 


M 

* 

1 


| / a | 

n 

(Datos no agrupados) 

X v, - M a n, 

I” z \x. - M A 

| si e \ i- 

(Datos agrupados) 1 D e = — ! ——- 1 


La desviacion mediana, sera m enor o igual a la D esviacion media y esta a la vez, sera menor que la 
Desviacion tipica : ID < D a <S 

Ejemplos 1. Con los siguientes datos calcular la desviacion mediana. 


a) 




x 2 = 3 


*3 =! 


x 4 = 6 


x 5 = 10 


Se calcula primero la mediana para ello ordenamos los valores de menor a mayor. 

1-3 - 5 -6-10 Luego establecemos las diferencias entre la variable y el promedio M 
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D - S 

x~M e 


e 

n 


E jemplo 2. Con datos agrupados, se pide calcular la desviacion media 


6 <10 

M e j=y,= 15 

r M e =X= 15 n 
l L _ l _i 


y, 

n , 

V 

5 

2 

2 

10 

4 

6 

15 

8 

14 <—N. 

20 

5 

19 

25 

1 

20 

X 

20 

- 

V 

/, 

F, 


Continuation: 



D e = 


'L\y l -M e \n l 


D = — = 3 75 
e 20 ’ 

E|X,-M I L 


lD e = 


N 


EJ ERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Sterna del nfor mad on 
en Lfnea SI L. 

24. Un conjunto de 20 valores tiene una media igual a 50; otro conjunto de 20 valores tiene una media 
igual a 30; la desviacion estandar de los 40 valores considerados conjuntamente es igual a 10. 
Calcular el coeficiente de variacion del conjunto de los 40 numeros. 

25. Reconstruya y calcule el coeficiente de variacion de la siguiente distribucion simetrica. (Para el 
calculo de la media y la varianza, hacerlo mediante el metodo que usted conoce). 




y t 

10 20 30 40 50 

\ f r 


n. 

l 

6 

J>! n j 


H 

l 

0,12 0,32 
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26. Hallar el coeficiente de variation de dos numeros, cuya media aritmetica es 5 y la media geometrica 
es 4. 

27. Se tienen los siguientes datos correspondientes a dos submuestras: 

x x = 120 x 2 = 125 n x =70 n 2 = 30 S x =36 S 2 = 3 
Se pide calcular el coeficiente de variacion para el conjunto. 

28. Se supone que X { X 2 X y .. X n son elementos que poseen una media aritmetica 10 y una desviacion 
tipica de 3. Si se considera una nueva media y., de cada uno de los elementos relacionados con la 
media X. mediante la ecuacion. 

v. = 4x. + 2 

j i i 

^Cual es la media aritmetica, la varianza y el coeficiente de variacion de los nuevos valores y. 
obtenidos? 

29. Las notas de 50 alumnos se clasifican en una tabla de frecuencias con cuatro intervalos de igual 
magnitud. Se pide calcular el coeficiente de variacion, sabiendo que: 

y 2 = 50 n x = 4 N 2 = 20 n 3 = 25 y = 62,4 

[Li_ 50 _ 20 _4_=i 5 _ _5^ 6 _^ 4 ] 

30. El cuadro de pagos en dos fabricas para el ano 2011 fue asi: 


MEDIDAS 

FABRICA A 

FABRICA B 

Salario medio semanal 

Desviacion tipica del salario semanal 

$930,000 

$96,000 

$1,020,000 

$97,000 


a) ^En cual de las fabricas los jornales fueron absolutamente mas variables? 

b) /,Relativamente mas variables? 


31. Se analizaron en el primer semestre del ano 1 los gastos de una empresa de la construccion y se 
obtuvo un promedio de $1,740 millones y una desviacion tipica de $90 millones. Se determino 
luego que los contadores de esta empresa habian prescindido de $13 millones en los gastos por un 
error de apreciacion. Corrigiendo las medidas enunciadas, obtenga el coeficiente de variacion de los 
gastos de esta empresa. 

32. Para cierta variable se sabe que M [4+X] = 11,2 y M [X+2 f = 30,25 
Calcule el coeficiente de variacion. 

33. En cierta region la distribucion de predios por extension tiene una media de 35,4 hectareas y una 
desviacion tipica de 19,33 hectareas, mientras que la distribucion por canon de arrendamiento tiene 
una media de $945,750 y una desviacion de $74,708. ^Cual de las dos distribuciones tiene mayor 
variabilidad? 

34. Una empresa fabrica bombillas electricas de dos tipos (Ay B), con base en muestras de la produccion, 
se sabe que las distribuciones de la duracion en horas de esas bombillas son tales que tienen las 
siguientes medias y varianzas. 


TIPO 

MEDIA 

VARIANZA 

A 

800 horas 

7.800 

B 

650 horas 

5.400 
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Se pide: 

a) Comparar ambas distribuciones en cuanto a su variabilidad absoluta y relativa. 

b) Si se extrajo una bombilla de cada tipo y su duracion fue de 700 y 630 horas respectivamente, se 
quiere saber cual tipo de bombilla tiene mejor posicion relativa. 

35. Un almacen vende un promedio mensual de $3,000,000 (cientos $) en telas con una desviacion 
tipica de $30,000 (cientos de $). 

a) El almacen paga un impuesto igual al 10% sobre las ventas. /,Cual sera la varianza de las ventas 
una vez pagado el impuesto? 

b) Las utilidades del almacen se calculan teniendo en cuenta que mensualmente se pagan $2,450,000 
(cientos de $) por salarios, gastos, etc., ademas del impuesto sobre las ventas. Calcule el 
coeficiente de variacion de las utilidades. 

36. Los siguientes datos muestran el numero de cuartos habitables en 60 viviendas localizadas en la 
ciudad de Cucuta. 


NO. DE CUARTOS: 

2 

4 

6 

8 

10 

NO. DE VIVIENDAS: 

6 

18 

16 

12 

8 


Obtenga e interprete para estos datos la desviacion tipica, la desviacion mediana y el coeficiente de 
variacion. 


37. Los trabajadores de una empresa solicitan, en una convencion colectiva, que cada salario semanal 
de sus afiliados sea aumentado segun la ecuacion: 

y. = l,13x+10.750 

La empresa tiene 1.000 trabajadores y antes de solicitar el reajuste salarial, devengaban un promedio 
de $ 120,000 semanal. 

a) ^Cual sera el nuevo promedio de ingreso mensual de los trabajadores si la empresa acepta la 
peticion? 

b) El coeficiente de variacion antes de solicitar el reajuste salarial es del 38%. ^Cual sera el nuevo 
coeficiente de variacion? 


38. Con los datos siguientes: 

Se pide calcular: 

a) La desviacion estandar. 

b) El coeficiente de variacion. 

c) El puntaje tipico semanal, si x = 24 

39. Al trabajar con cierta informacion se obtienen los siguientes datos: X = 36 S = 8 CV = 0 , 22 . 

Si a cada uno de los valores de la variable se les aumenta en 5 ^Cuales serian las nuevas medidas: 
media, desviacion estandar y coeficiente de variacion? 


Yy.n^ = 1.500 —» 

Zyjn, =40.000 -»• 

« = 100 —> 



40. Con los datos correspondientes a dos submuestras. 


V 

4 

6 

7 

6 

10 

6 

4 

15 

6 

Vr 

10 

18 

12 

20 

8 

10 
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Se pide: 

b) Determinar en cada una de las submuestras la mejor posicion de los siguientes valores 
X = 8 y y = 15. 

c ) Transformando las dos submuestras en una sola muestra, calcular el coeficiente de variacion. 

41. Con la siguiente distribucion de frecuencias: 


b) n = 8 

x : 8 10 7 30 25 38 47 70 

i 

Se pide determinar: 

1 ) En cual de las dos distribuciones (a y b) hay 
una mayor variabilidad absoluta. 

2) En cual hay una menor variabilidad relativa 

3) Si se tiene un valor x = 33, en cual de las dos 
distribuciones, dicho valor tiene una mejor po¬ 
sicion relativa. 

42. En un grupo de 70 personas, se sabe que 30 de ellas tienen un salario medio diario de $27,000 y los 
restantes de $32,000. 

a) Se pide calcular el salario medio diario de las 70 personas. 

b) Si se sabe que el coeficiente de variacion es del 35%, ^cual es la varianza de los salarios diarios 
de las 70 personas? 

43. Si la media de 10 observaciones es 5,7 y la suma de los cuadrados es 490. Encontrar el coeficiente 
de variacion para el conjunto. 

44. Los siguientes datos corresponden a la distribucion de frecuencias de los gastos de publicidad (miles 

de millones de pesos) de 50 empresas comerciales, durante el ultimo trimestre de 2011. Dichos 
gastos se agruparon en cuatro clases de amplitud constante, de la cual se sabe: 

y x = 3,5 y ^ = 8,75 n x = 4 N 2 = 20 n 3 = 25 

Se pide calcular el coeficiente de variacion, la desviacion media y la desviacion mediana. 

45. Con la siguiente distribucion calcule: 

a) La desviacion tipica o estandar. 

b) La desviacion media. 

c) La desviacion mediana. 

d) Coeficiente de variacion. 


y’i-i -y / 

V 

10,1-16 

4 

16,1-22 

12 

22,1-28 

25 

28,1-34 

35 

34,1-40 

44 

40,1-46 

50 

X 

- 

X M -X, 

F, 



46. En la siguiente distribucion de resistencia a la tension (en kgrs./mm 2 ) de laminas de acero. Obtenga 
la desviacion mediana: 
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RESISTENCIA: 

10 a 20 

20 a 30 

30 a 40 

40 a 50 

% DE LAMINAS: 

0,20 

? 

? 

0,12 


Nota: se sabe que la resistencia promedio es de 29,4 kgrs./mm 2 . 


47. La siguiente distribucion de frecuencias se refiere al numero de compradores de un determinado 
producto, en 30 barrios de clase media en Bogota. 


a) Calcule la desviacion mediana. 

b) Calcule el coeficiente de variacion mediana. 

c) Si la empresa considera que el numero de 
compradores por barrio es el doble. ^Cual sera la 
nueva varianza y el coeficiente de variacion? 


48. Con los siguientes datos se pide: 

2 ) x.: 8 10 7 30 38 25 47 70 

b) Si se considera (1) y (2) como submuestras, ^cual sera el 
coeficiente de variacion para el conjunto o sea cuando 
n — 48 — 40 + 8. 

c ) Con la distribucion (1) determine la desviacion media. 

c) Con la distribucion (2) determine la desviacion mediana. 

d) Compruebe con la distribucion (a) que 

De < Da < S 




49. 

50. 

51. 


Con los siguientes datos: 2 5 8 12 y 20. Calcular la desviacion tipica, desviacion media y 
mediana. Observar que S > Da > De 

Calcular el coeficiente de la desviacion media a los ejercicios: 47 48 y 49 

Calcular el coeficiente de la desviacion mediana a los ejercicios: 47 48 y 49 


RECORRIDO INTERCUARTILICO, DESVIACION CUARTIL 
Y COEFICIENTE DE DESVIACION CUARTIL 

Se considera una serie de medidas de dispersion cuando se ha trabajado con CUdrtiles, deciles o percentiles. 
Entre los mas importantes se tienen: 

El recorrido intercuartllico , se define como la diferencia entre el tercer cuartil y el primero. 

0 « = 0 3 - 0 , 

El recorrido interdecil , corresponde a la diferencia entre el noveno y el primer decil. 

D« = D 9 -d x 






















164 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


La desviacion cuartil 0 semi-recorrido intercuartilico , se obtiene, mediante el calculo del recorrido 
intercuartilico divido entre 2. 



Este estadigrafo, en una distribucion normal, equivale a 0,6745 veces la desviacion estandar. 


El coeficiente de desviacion cuartil , es aplicado, especialmente, en aquellas distribuciones cuyos 
valores extremos no se encuentran definidos o cuando se desea obtener una rapida estimacion de la 
dispersion, no necesaria para posteriores calculos. 



El recorrido interdecil se calcula estableciendo la diferencia entre el noveno y el primer decil, lo 
mismo, para obtener el recorrido interpercentil sera la diferencia entre el percentil 99 y el percentil uno. 

^d = D 3 Pd = P 99 ^1 

Ejemplo 1. Con la siguiente distribucion calcular el recorrido intercuartilico, la desviacion cuartil y el 
coeficiente de desviacion cuartil. 


y\~ i -y; 

n < 

V 

30.1- 38 

38.1- 46 

46.1- 54 

54.1- 62 

62.1- 70 

70.1- 78 

78.1- 86 

86.1- 94 

6 

14 

n. ^36 

50 

43 

n. -^52 

18 

9 

6 

20 

56 <—TV. 

106 

149 

181 <—TV. 

199 

208 

i 

208 

- 

T 

1 

f, 



Primer cuartil 


n_ _ 2^8 _ ^2 no es ta en j a columna de N por lo tanto se toma a /V = 20 y N. = 56 . 

4 4 i-i s i 

Yl 

Siendo que N f _ x < — se tendra: 


Q\ -y)-\+c 




a 


= 46+8 


52-20 

36 


53,11 


Tercer cuartil 

3 n _ 3(208) 

a a =156 como no se encuentra en la columna de las frecuencias absolutas acumuladas, 
^ ^ 3 n 

se toma a A/. =149 <156 y A/. = 181 > 156 . Ahora, cuando se presenta N. < se tendra: 






















CAPITULO CUATRO 

MEDIDAS DE DISPERSION, DE DEFORMACION Y APUNTAMIENTO 


165 


Qi - y}-i+ c 




Reemplazando Qi —70+8 


156-149 

32 


71,75 


Recorrido intercuartflico: 0 D = 0 3 ~ Q, 0 D = 71,75 - 53,11 = 18,64 

0 ~ O 71 75 - 5311 

Desviacion cuartil sera igual a: n _ l _ Q = — 1 —-— 1 — = 9,32 

v »,- 2 - 2 

Coeficiente de desviacion cuartil sera igual a: 



_ 71,75 -53,11 
0 - 71,75 + 53,11 


18,64 

124,86 


= 0,1439 6 14,39% 


E jemplo 2. Con la misma distribucion anterior calculemos el recorrido interdecil, la desviacion interdecil 
y el coeficiente de desviacion decil. 


Primer decil: 


= 20,8 Este valor no se encuentra en la columna de las frecuencias absolutas acumuladas, 
por lo tanto N. x = 20< 20,8 y N . = 56 > 20,8 , la formula de calculo que debe ser aplicada sera: 


^ - y)~ i + c 

T 

feT 

i 

r|© 

i_ 

\ — L l + / 

n r7 

10 Fj -' 

n t 

f, 






Reemplazando en la formula anterior se tendra: A _ 46 + 8 


20,8 - 20 

36 


= 46,18 


Noveno decil: 

9n = 9(208) = m , 2 siendo que = 181 < 187,2 y N f = 1 99 > 187,2 se tendra que: 


D 9 -y'._ x +C 


9/7 

— — N 
10 /- 1 


D 9 = 78 + 1 


187,2-181 

18 


= 80,76 


D 9 - L- + i 


— f 

10 ^ 

f, 


El recorrido interdecil: D R = D 9 ~D l 


D R =80,76-46,18 = 34,58 
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La desviacion interdecil: 



M, 

2 


D» = 


80,76-46,18 

2 


= 17,29 


El coeficiente de desviacion decil: 


C D = 


p 9 -A 


_ 80,76 - 46,18 
D - 80,76 + 46,18 


17,29 _ „ 

126,94 13,62% 


13,62% 


RECORRIDO U OSCILACION 

El recorrido, denominado tambien como oscilacion o fluctuacion, es un estadigrafo facil de calcular y su 
significado muy sencillo. Se calcula tomando la diferencia entre los valores extremos, sin tener en cuenta 
la repeticion o frecuencia de los valores que toma la variable, de ahi su gran inestabilidad, especialmente 
cuando se anaden o suprimen cifras extremas. 

Recorrido = X max X mjn (para datos no agrupados) 


En datos agrupados, para variable discreta el recorrido se obtendra asi: recorrido = y m - y f . 
Para la variable continua se calcula aplicando recorrido = y' m ~ y' 0 

E jemplo 1. Supongamos que se tienen 5 observaciones: (datos no agrupados) 

Xj = 8 x 2 =4 x 3 =6 x 4 =6 x 5 = 12 

Recorrido = X ma - X. Rango = 12 -4 = 8 

max mm 0 

E jemplo 2. Tomemos una distribucion de frecuencias para una variable discreta 

Recorrido = y m - y 1 

Recorrido =10-2 = 8 

[--- 1 

Recorrido = X - X 1 
i_ n J _ 



E jemplo 3. En el caso de una variable continua el procedimiento es casi igual al anterior. 



Recorrido = y m - v 0 
Recorrido = 23 - 3 = 20 

i-1 

Recorrido = X„. - X,, 

i__°J 
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MEDIDAS DE ASIMETRIA 0 DE DEFORMACION 


Fueron propuestas, algunas de ellas, por Karl Pearson. Una distribucion simetrica no tiene riesgo; 
recordemos que en este caso M x = M e = M d , estas medidas son iguales, por lo tanto consideramos que la 
distribucion tiene la forma de una campana, denominada de Gauss o normal, ya que el promedio se ubica 
en todo el centro de ella. 

Si las frecuencias son considerablemente altas, la distribucion deja de ser simetrica y hablamos de 
distribuciones asimetricas positivas o negativas y las tres medidas (media, moda y mediana) no tienen 
igual valor. 

En las graficas que se presentan a continuacion se observa que en la parte mas alta de la distribucion 
se ubica el Modo. 


Si M ! > M e > M d se dice que la distribucion es asimetrica negativa , ya que la curva presenta un 
alargamiento hacia la derecha. Si por el contrario M x = M e = M d , el alargamiento es hacia la izquierda y 
se dice que es asimetrica positiva. 



K K K 

M d < M e < M x 

Asimetrica positiva 




Asimetrica negativa 


Las formulas utilizadas para calcular el grado de asimetria son: 




2 ) A s = 


3 (M x - M e ) 


3) A=- 


m-. 


En la ultima se utiliza el momento de orden 3 con respecto a la media 


Zd? f, 

I m 3 = —I 
i_ j 


K.v. -.v) ! n, 


El grado de asimetria, tambien se puede calcular aplicando la formula establecida por Bowley, 
03 + Q\ — 202 


siendo: A s = 


03 + 0i 


, para ello es necesario, trabajar con cuartites. 


Si A= 0 Simetrico Si A> 0 Asimetrico positivo Si A< 0 Asimetrico negativo , ya que el 
signo nos indicara hacia que lado se presenta la deformacion o alargamiento de la distribucion y el valor 
sera el grado de asimetria, entre mas grande sea este valor, mas grande sera la asimetria. 


E j emplo 1. Con los siguientes datos de una distribucion de frecuencias, se puede calcular la asimetria y 
su grado, por las formulas anteriormente establecidas. 
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y> 

n , 

y, n , 

N, 

y] n <. 

(y,-y) 

(y-y) 3 

(y, - y) 3 n, 

2 

4 

8 

4 

16 

-3,3 

-35,94 

-143,76 

4 

6 

24 

10 ->W H 

96 

-1,3 

-2,20 

-13,20 

6 

5 

30 

15 -w 

180 

0,7 

0,34 

1,70 

8 

3 

24 

18 

192 

2,7 

19,68 

59,04 

10 

2 

20 

20 

200 

4,7 

103,82 

207,64 

£ 

20 

106 

- 

684 

- 

- 

111,42 


f, 

X,f, 

A 

V 2 /, 

d, 

A 

d].f, 




L_ 11 J 

I 


M d = y. = 4 (modo) 


M„ = 


^y-i + Zz 


M„ = 




M. 


4 + 6 


a) A s = 


Mi ~ M d t 5,3-4 


As — 


1,3 


2,47 2,47 


=0,53 


r , 2 _II, 2 /,-«I 2 | 


S =■ 


n 


s 2 =. 


= Ml-5,3 2 =34,2 -28,09 = 6,11; s = V 6 J1 = 2,47 


20 


,, . 3 (Mi-M e ) _ 3(5,3 - 5) 3(0,3) _ 0,9 

b ) is 5 * 2,47 2,47 2,47 

, ,, _ m 3 _ 5,57 _ n „ I(y f -7) 3 n f 111,42 | L/ 3 /^ 

c) As - — - TT 777 - u ’ 37 - 5 - '-= — =5,57 I to - ' 


S 3 15,07 
Siendo: M. > M a > M . 

1 e d 

5,3 > 5 > 4 

La distribution es asimetrica positiva 


20 


i _ L ~ _!y_I 



La dsimetria , tambien es calculada mediante la aplicacion de la formula de Bowley, donde 

a _ 03 + Si - 202 


03 +01 


Veamos como se calcula con los datos de la distribucion anterior: 

?0 

0 , = y 5 = 4 —> siendo: = 5 =4 y N f = 10 

0 3 — ~~~ — 7 —> siendo: =15 7^=15 y 7V ; =18 

„ r , . * (7+ 4)-2(5) 1 

0 2 = mediana = 5 -> A s =- _ -= — = b,33 

Afota: la aplicacion de las anteriores medidas es preferible hacerla con la variable continua, usando 
los intervalos de clase. 
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Nota: Los resultados obtenidos en la aplicacion de las formulas anteriores, arrojan resultados 
diferentes sin que esto tenga importancia alguna. 

Ejemplo 2. Determinar si es grande o pequeno el grado de asimetria, en una distribucion cuyos 
estadigrafos de posicion son: 

x = 189,87 M e = 189,16 M d = 187,60 

o 

Aplicando la formula empirica: x ~M d = 3 (X - M e ) 

189,87 - 187,60 = 2,27 ^ 2,13 

3 (189,87) - 189,16 = 2,03 La diferencia nos indica que existe una pequena asimetria. 

Ejemplo 3. Tomando una distribucion ligeramente asimetrica. Calcular el modo sabiendo que su media 
es igual a 3 y que la diferencia entre la media y mediana es igual a -2 

o 

~x-M d = 3 (X -M e ) 3 -M d = -6 

3 -M d = 3 (-2) M d = x- 3(X-M e ) M d = 9 

Ejemplo 4. Calcular el coeficiente de asimetria en la siguiente distribucion, utilizando la formula de 
Pearson. 


y<- 

i 

2 

3 

4 

5 

6 

a ■ 

2 

8 

3 

5 

7 

5 


o 


y> 

n , 

y, n i 

xf”i 

l 

2 

2 

2 

2 

8 

16 

32 

3 

3 

9 

27 

4 

5 

20 

80 

5 

7 

35 

175 

6 

5 

30 

180 

2 

30 

112 

496 

x, 

fi 

x,f, 

x?f, 


\X = 


ZXjfi 

_N_ 

Zy f . n f 


s 2 = ^y L n L -t 

n 

a -y-M d 


112 , 

y= ^o =3J 3 






N 


-X z 


Mj - 2 


S 2 = ^ - 3,73 2 = 2,62 
3 73 - 2 

^=Tffl- = 1 ' 07 


As -' 


s = 1,62 

X~ M d 


S 


EJ ERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Sterna del nfor mad on 
en Lfnea SI L. 


52. Conteste si es cierto o falso y por que: 

^ 2 ( Ta X V 

a) En toda serie de datos - f — es mayor o igual a - L 

n n 

n V ) 

b) Si para dos distribuciones X x = x 2 y S*> S 2 2 entonces CM x < CM 2 
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c) Si el coeficiente de asimetria es negativo, la curva es achatada. 

d) Si las frecuencias de una distribucion se multiplican por 8, la varianza queda multiplicada por 
64. 

e) La varianza esta expresada en las mismas unidades de la variable. 

53. Conteste los siguientes puntos diciendo si es cierto o falso y por que: 

a) El coeficiente de variacion no puede ir expresado en unidades de la variable. 

b) El coeficiente de variacion, es la desviacion estandar expresada en terminos de porcentajes de x. 

c) Si una distribucion es simetrica o moderadamente asimetrica, entre X ±2 S esta el 95,5% de las 
observaciones. 

d) La desviacion tipica no se mide en las mismas unidades de la variable. 

54. Con con la informacion sobre el numero de retardos anuales, de los 500 empleados de una empresa 
calcular el coeficiente de asimetria de Pearson. 

x= 9.725 M e = 9.672 S = 1.217,50 

55. Con los siguientes datos determine la simetria o asimetria de la distribucion aplicando las diferentes 
formulas vistas. 


y t 

n , 

5 

3 

7 

39 

9 

10 

11 

8 

13 

7 

15 

3 

X 

70 

V 

/, 


y> 

n i 

5 

3 

7 

7 

9 

8 

11 

9 

13 

30 

15 

3 

X 

60 

V 

f, 



Haga los respectivos histogramas y dibuje los poligonos de frecuencias. 


M EDIDAS DE APUNTAMIENTO : A 

urtosis 0 estadigrafos de apuntamiento. Una caracteristica importante de la variacion en algunas 
distribuciones, es su grado de agudeza en la cima de la curva que las representa. Esta agudeza que se 
observa en la region del M odo, comparada con las condiciones halladas para el mismo sitio en la curva 
normal, es lo que se llama urtosis 0 curtosis. 

Si la curva es mas plana que la normal , la distribucion se le considera achatada o planticurtica y si es 
mas aguda se le denomina apuntada o leptocurtica. Si la curva es normal se dice que es mesocurtica. 


La curtosis es una medida de altura de la curva y por tanto esta representada por el cuarto momento de la 
media. En la misma forma que para la asimetria, su calculo se efectua en funcion de la desviacion tipica 
y de los momentos unidimensionales de orden cuatro con respecto a la media aritmetica: 

m 4 

A — —- Siendo 3 el valor de en la curva normal, 

f 's s 




m A = 


x(x,-x) 4 /; x</; 


m A = 


N 


n 


L 


N 


j 
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A p >3 
A p < 3 


—> la distribution es normal o mesocurtica 

la curva es leptocurtica o apuntada 
—> la curva es platicurtica o achatada 



E jemplo 1. Calcular el grado de apuntamiento en la siguiente distribution: 


y, 

n > 

(y-yf 

(y-y,1"i 


2 

4 

-35,94 

474,41 

m.= 

4 

6 

- 2,20 

17,16 


6 

5 

0,34 

1,19 


8 

3 

19,68 

159,41 

S 2 = - 

10 

2 

103,82 

975,91 


Z 

20 

— 

1.628,08 

■ 

i 

i 

x, 

f, 

df 

dff 

i w 4 = 

i 

i 


y(y-y,1 n , 

n 

Uy-yi", 

n 

*d?f, \ 

N i 


1.628,08 

20 


=81,404 


=6,11; S 4 =37,33 



A =—f — = 2.18 2,18 < 3 la curva es achatada o platicurtica. 

p S A 37,33 


Ejemplo 2. Con los siguientes datos: 




10.1 - 16 

4 

16.1 -22 

8 

22,1 -28 

13 

28,1 -34 

10 

34,1 -40 

9 

40,1 -46 

6 

Z 

50 

xi-i -xi 

f 


Se pide calcular: 

a) Los coeficientes de asimetria. 

b) Los coeficientes de apuntamiento. 
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. ^ 3 (y-M„) A _ 3(28,6- 28,1) . 

a) A s =—— - A -8736-0,1717 (asimetriapositivaA $ >0) 


, 3 (X-M e ) 

A « ~ s 


b) 4. = 


m. 


s* 


m 4 = 






m. =- 

4 /7 


y, _ 

«/ 

y-y 

(y-yf 

(y-yf 

(yjf 

(y-yf"i 

13 

4 

-15,6 

243,36 

-3.796,41 

59.223,99 

236.895.96 

19 

8 

-9,6 

92,16 

-884,74 

8.493,50 

67.948,00 

25 

13 

-3.6 

12,96 

- 46,66 

167,98 

2.183,74 

31 

10 

2,4 

5.76 

13,82 

33,17 

331,70 

37 

9 

8,4 

70,56 

592,70 

4.978.68 

44.808,12 

43 

6 

14,4 

207,36 

2.985.98 

42.998.11 

257.988.66 

S 

50 

— 

— 


— 

610.156,18 

v, 

f 

d, 

d , 2 

d \ 3 

d? 

d?f 


d,= X-X, i y = = 28,6 = X 

' ' ' : • 50 


=12.203,12 s 2 = 76,32 s 4 = 5.824,74 

1 9 909 19 

A p = - ^ 0474 - = * 2,09 <3 achatada 6 platicurtica 

EJ ERCICIOS MISCELANEOS 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

56 Con los siguientes datos: 


28 

42 

64 

32 

68 

25 

34 

40 

51 

62 

36 

56 

76 

40 

70 

28 

38 

46 

58 

64 


Se pide: 

a) Trabajando con los datos originales calcular la desviacion tipica, desviacion mediana y el 
coeficiente de variacion. 

b) Agrupar los datos en una tabla de frecuencias, teniendo en cuenta que la amplitud es constante 
(la variable es continua) y m = 6 , calcular el coeficiente de variacion. 



z rJf-y 


m 4 =. 


zot-yf*, 


a 

A p 


57. Suponga que se tiene otra distribucion que presenta las siguientes medidas: 
Comparando con los resultados del ejercicio anterior (No. 56), determinar: 


y = 38,5 y S 2 = 36 
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a) ^Cual de las dos distribuciones presenta una menor variabilidad absoluta? 

b) ^Cual de ellas presenta una mayor variabilidad relativa? 

c) Si consideramos que la primera distribucion presenta un valor de x = 48 y en la segunda (o sea 
la del punto c) el valor de x = 50, ^cual de estos valores presenta una mejor posicion relativa? 

58. a) Calcular el grado y la direccion de la asimetria con los datos de la tabla de frecuencias del punto 

56(b) 

b) Calcular el grado de apuntamiento en esa distribucion, determinando si es normal, achatada o 
apuntada. 

59. Se tiene una distribucion de 6 intervalos de amplitud constante, de la cual se sabe que: 


1 =150 

n 3 = n 4 = 30 

n 2 = n s = 

= n, + 5 

", 

= n e 

y 5 = so 

y = 41 

'=150 

f 3 = f 4 = 30 


f , + 5 


= $ 

X=50 

X= 41 


a) Calcular el coeficiente de variacion 

b) Calcular el coeficiente de asimetria aplicando las diferentes formulas expuestas c ) Calcular el 
coeficiente de apuntamiento. 

60. Con los siguientes datos, se pide calcular: 


a) Varianza 

b) Desviacion tipica 

c) Coeficiente de variacion 

d) Desviacion media 

e) Desviacion mediana 



61. Con los datos del punto 51 calcular: a) el grado de asimetria; b) grado de apuntamiento. 


62. Se tiene dos distribuciones: 

1) Corresponde a datos agrupados 



2 ) Corresponde a datos sin agrupar 

Xj = 12 x 3 = 6 x 5 = 23 x y = 4 x g = 6 
x 2 =18 x 4 = 20 x 6 =17 x 8 =10 x 10 = 4 


Se pide determinar: 

a) En cual distribucion se observa una mayor variabilidad absoluta? 

b) En cual distribucion se observa una menor variabilidad relativa? 

c) Si consideramos un valor de 18, en cual de las distribuciones se tiene una mayor posicion 
relativa? 
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63. Se pide calcular el coeficiente de variacion para el total de las 70 observaciones (A+B) del ejercicio 

62. 

a) <^Que pasaria con este coeficiente de variacion, si multiplicamos a cadauna de las 70 observaciones 
por 5? 

b) <^Que pasaria con este coeficiente de variacion, si le sumamos 10 a cada una de las 70 
observaciones? 

64. Considerando unicamente la distribucion (A) para datos agrupados: (Ejercicio 61) 

a) ^La distribucion es simetrica o asimetrica? ^cual es su grado de asimetria (si fuera la respuesta 
afirmativa) a que lado se presenta? 

b) Calcule el grado de apuntamiento. 

65. Los salarios mensuales que paga una fabrica a los operarios que trabajan en dos turnos, tiene las 

siguientes estadisticas: 


MEDIDAS 

TURNO 1 

TURNO II 

Numero de trabajadores 

38 

62 

Salario medio mensual 

978.000 

1.203.500 

Varianza 

851.600 

962.600 


a) Comparar los salarios en los dos turnos en cuanto a variabilidad absoluta y relativa. 

b) Obtener el coeficiente de variacion para el salario de los 100 operarios. 

c) Cual sera el coeficiente de variacion para el ano entrante si el gerente ofrece un aumento de 
$22,000 para los del primer turno y un 7% para los del segundo turno. El coeficiente de variacion 
a calcular, se refiere al total de los 100 operarios. 

66 . Con los siguientes datos, correspondientes a una distribucion de frecuencias, se pide calcular el 
grado de simetria o asimetria, indicando hacia que lado, lo mismo que el grado de apuntamiento. 
Ademas calcular: 


a) El coeficiente de variacion 

b) El puntaje tipico, si se tiene queun valor de y= 12 

c) La desviacion media y mediana 



67. A los trabajadores de una empresa, el proximo ano, el salario mensual les sera aumentado en un 
4,2% mas $8,000. La empresa tiene 600 trabajadores y actualmente devengan un salario medio 
mensual de $810,000, con un coeficiente de variacion de 0,36. 

a) /,Cual sera la varianza de los salarios el proximo ano? 

b) El proximo ano, ^cual sera el valor total de la nomina mensual? 


68 . Con los siguientes datos no agrupados: X j : 6 4 8 2 10, calcular: 
a) Desviacion media b) Desviacion mediana 
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c) Desviacion tipica d) Comprobarque D g < D g <S 

e) Calcular el coeficiente de variacion 

69. Con la siguiente informacion: X = — [ 16 y +16] C V = 0,40 y = 5 
Hallar el coeficiente de variacion de X 

70. Sabiendo que y = 6 -10X V = 8. Hallar la varianza de 4x - y 

71. ^Por que es cero el coeficiente de asimetria para una distribucion simetrica? 

72. Dos obreros del mismo y trabajo muestran los siguientes resultados en un periodo determinado 


MEDIDAS 

OBREROS 

A 

B 

Tiempo promedio para el desarrollo de su trabajo 

42 


35 minutos 

Desviacion tipica 

8 


6 minutos 


a) ^Cual grupo es el mas regular en el desarrollo de su trabajo? 

b) ^Cual grupo es el mas rapido en terminar el trabajo? 


73. Un estudiante obtuvo las siguientes notas en 4 de sus materias asi: 

Economia = 4 Matematica = 3,3 Ingles = 3,6 y Derecho = 4 ,2 

a) ^Que clase de opinion podriamos dar con respecto a esas notas? 

Recurrimos a los profesores que en un analisis han podido reunir mas informacion sobre el 
rendimiento del curso donde se encuentra el estudiante. 

Promedio del curso: Economia = 4,3 Matematica = 2,8 Ingles = 3,2 y Derecho = 4,6. 
Ademas, conocen las desviaciones tipicas, siendo: 0,6 0,75 0,8 0,6 respectivamente. 

b) ^Su opinion se mantiene igual respecto al rendimiento de este estudiante? 


74. Supongamos que un acucioso empleado de la empresa de Acueducto de la ciudad, realiza una muestra 
de 60 usuarios del servicio, sobre los reclamos en los 2 ultimos anos por esas personas, con los 
siguientes resultados: 


NUMERO 

DE RECLAMACIONES 

NUMERO 

DE USUARIOS 

0 

26 

1 

10 

2 

8 

3 

6 

4 

4 

5 

3 

6 

2 

7 

1 


Se pide hallar: 

a) El promedio de reclamos 

b) La varianza y su desviacion tipica 

c) El coeficiente de variacion 















176 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 



En el resumen del capitulo anterior, se decia que no basta con calcular el promedio para 
describir el comportamiento de un conjunto de datos, sino que ademas, en numerosos casos, 
requiere de la aplicacion de alguna de las medidas de dispersion, las que nos determinan la 
extension que ocupan los valores de la variable respecto al valor promedio elegido. 

Supongamos que dos personas conocedoras de estadistica se dedican a lanzar dardos y en 
el primer lanzamiento ambos lo colocan el tercer circulo uno arriba y el otro abajo, es de 
imaginar que ambos se sientan satisfechos del lanzamiento, pues lograron la misma distancia 
con respecto al centro. Se puede sacar como conclusion que el punto central fue para ellos 
menos importante y la atencion se centro mas en la distancia o dispersion que a dar en el 
bianco o punto central. 

El calculo de un promedio para dos grupos puede ser igual, como por ejemplo el promedio de 
calificacion de dos cursos de estadistica con diferentes profesores, en ambos se obtuvo 3,7, 
pero se observa que en el primero de ellos la calificacion minima fue de 1,1 y la maxima de 
4,3, en cambio con el segundo profesor la minima fue de 3,4 y la maxima de 4,2 <^que profesor 
le recomendaria a su hermano si hubiese necesidad de elegir uno de ellos? En este ejemplo 
se le da importancia a la dispersion; como se puede observar, no siempre el promedio por si 
mismo nos proporciona una suficiente informacion. 

Son varias las medidas o varios los procedimientos que nos indican el mayor o menor grado de 
dispersion, siendo la mas conocida la desviacidn estandar o desviacidn tipica. La varianza es 
el procedimiento que nos permite llegar a la desviacion tipica, con el inconveniente que no se 
expresa en la misma unidad de medida de la variable, ya que siempre corresponde al cuadrado 
de ella, asi se tendra: metros, kilos, horas al cuadrado, en cambio la desviacidn estandar 
y el recorrido, se expresan en las mismas unidades. Cuando el coeficiente de variacion se 
expresa en porcentajes, permite realizar mejor la comparacidn de la dispersion entre dos o 
mas distribuciones, cuando las variables estan expresadas en unidades de medidas diferentes. 

Decimos que una distribution es simetrica , cuando la media , mediana y la moda calculada 
en una variable son iguales. El grado de Sl'metria o asimetria en una distribucion se obtiene 
aplicando la medida denominada coeficiente de asimetria o simplemente observando el 
histograma de frecuencias. El problema se presenta cuando la distribucion tiene forma de U, 
siendo considerada no normal, ya que no tiene la forma de campana de Gauss que siempre 
utilizamos para indicar una distribucion simetrica. 

Finalmente recordemos que los valores observados, si bien es cierto se repiten, en conjunto son 
diferentes si las comparamos entre si, por lo tanto esta dispersion no puede pasar desapercibida 
y su informacion radica cuando tiende a agruparse alrededor del promedio, de ahi que no solo 
calculamos estos ultimos, pero ademas, debemos acompanarlo con tecnicas que nos permitan 
estudiar la variacion, cuando encontramos diferentes distribuciones con diversos grados de 
dispersion. Vale la pena resaltar como en la fabricacion de articulos de precision, una pequena 
variacion puede influir en su mal funcionamiento. 







CONTENIDO 


Nociones 
elementales 
de probabilidad 

No a o a ta 

t o a o 
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■ Conceptos, usos y aplicaciones de las 
probabilidades. 

■ Probabilidad a priori, clasica, subjetiva y 
de frecuencia relativa. 

■ Espacio muestral, Diagrama de arbol, 
Tecnicas de conteo, Combinaciones y 
Permutaciones. 

■ Sucesos mutuamente excluyentes, inde- 
pendientes y dependientes. Probabilidad 
condicional. Teorema de Bayes. 

■ Smtesis de la Unidad 

■ Ejercicios para Resolver, resueltos en el 

Sistema de I nformacion en L mea SI L. 

COM PETENCIAS 

El estudiante debera estar en capacidad de: 

□ Conocer, entender y manejar los concep¬ 
tos basicos de probabilidad. 

□ Calcular probabilidades, aplicando las 
reglas de adicion y multiplicacion. 

□ Manejar y aplicar los conceptos de la 
Permutaciones y Variaciones. 

□ Entender y aplicar el Teorema de Bayes. 

□ Entender la importancia que ella tiene 
en la inferencia, para realizar ase- 
veraciones sobre un entomo incierto o 
de incertidumbre. 
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GENERALIDADES 


El concepto de probdbiliddd puede ser interpretado como algo indefinible, pero utilizado para expresar, 
de algun modo, un grado de creencia que uno tiene de la ocurrencia de un suceso; nos referimos a algo 
que puede suceder con base en la experiencia que se tenga. Con frecuencia observamos o escuchamos 
el estado del tiempo, o sea los pronosticos meteorologicos sobre la posibilidad de buen tiempo o la 
presencia de lluvias fuertes o ligeras, gran nubosidad, vientos fuertes o en calma, etc.; los hinchas de 
los diferentes equipos de futbol discuten frecuentemente sobre la posibilidad de clasificacion o de ganar 
el campeonato; algo similar ocurre con los que juegan loteria o apuestan en las carreras de caballos; el 
mismo alumno, cuando se refiere a la posibilidad que tiene de ganar o de perder una asignatura; todos 
ellos son pronosticos que hacemos con la esperanza de que sucedan. 

El origen de las probabilidades en los juegos de azar se remonta al siglo XVII, cuando Antoine 
Gombauld, mas conocido como el caballero de Mere, jugador profesional quien penso haber descubierto 
una tactica infalible de jugar a los dados, con muy buenos resultados durante un determinado tiempo, 
despues del cual comenzo a perder y por ende disminuyo su fortuna, situacion que lo obligo a consultar 
a Bias Pascal y a Pierre de Fermat, iniciandose asi poco a poco una ciencia bien fundamentada. 

En la actualidad las probabilidades guardan una estrecha relacion con la Teorfa de Conjuntos, de 
gran importancia en el campo de la / nferencid EStadlSt'lCd debido a la incertidumbre que siempre se tiene 
en la toma de decisiones, permitiendo el analisis de los riesgos que se corren y la forma de minimizar 
el azar inherente. En estadistica, el uso de las predicciones es de gran utilidad cuando se realizan inves- 
tigaciones por muestreo, en la mayorfa de los casos obligado por el costo y tiempo que con llevarfa la 
realizacion de una investigacion total, lo cual nos limita a un reducido numero de elementos; y con base 
en esa informacion disponible, procedemos a la realizacion de predicciones o estimaciones, asignando 
limites de confianza a esos resultados. 


Las probabilidades, conjuntamente con la estadistica tienen infinidad de aplicaciones a problemas 
de economia y ciencias sociales, de la misma manera a las ciencias fisicas, industria, comercio y gobier- 
no, con la observacion de que en cada uno de ellos tendra sus requisites particulares. 


Se puede hablar de Posibilidddes y d e P robabilidades, el primero hace referencia a la comparacion 


entre el numero de resultados favorables con los desfavorables: 


N°. de defectuosos 

N°. de no defectuosos 


En el segundo 


es el cuociente entre el numero favorable sobre el total de casos posibles: 


N°. de defectuosos 
Total de casos posibles 


Todos en esencia somos jugadores. En los negocios, en nuestra vida y siempre que tomamos una 
decision, siempre va haber incertidumbre por la dificultad de predecir con exactitud: ^Ganare el parcial? 
^E1 semestre? ^Me ganare el Baloto si lo compro? ^Si le hablo a esa persona me corresponded? Todas 
estas preguntas y muchas mas, tendrian en nuestra mente una posible respuesta ya que nos dejamos guiar 
por la experiencia y la intuicion. 


Definiciones. Es dificil dar una definicion exacta de las probabilidades, sin embargo trataremos de 
obtener alguna que nos aproxime a ella. 
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M todo axiomatico. El cual concibe la probabilidad de ocurrencia de un suceso, Como un numero com- 
prendido entre y 1 . Este concepto tiene que ver directamente con la notion de frecuencias relativas, 
donde 0 < h < 1. 

l 

Supongamos que se lanza 100 veces una moneda, anotamos el numero de veces que sale cara y las 
veces que sale sello; los resultados fueron los siguientes: 


Frecuencia absoluta: 

cara 56 veces 

sello 44 veces 

Frecuencia relativa: 

56/100 

44/100 

Probabilidad: 

p = 56% (exito) 

q = 44% (fracaso) 


Se puede establecer una escala de valores comprendidos entre 0 y 1. La probabilidad igual a uno 
corresponde al limite superior, el cual se considera como la certeza absolilta; por ejemplo, la probabili¬ 
dad de que algun dia moriremos, esto es un hecho que tiene que cumplirse. Para el otro extremo igual a 
0, consideraremos por ejemplo, “que se atravesara el Oceano Atlantico a nado”, lo cual es imposible, asi 
que la probabilidad sera 0. En este caso se habla de imposibilidad absoluta. 

Si la probabilidad fuera 0 6 1 no habrfa problema, pero existen una serie de fenomenos cuyos valo¬ 
res estan comprendidos entre esos limites que dificultan un poco el calculo. 

Se llamara suceso a cada caso posible, es decir, a la realizacion de un acontecimiento y este puede 
ser: 


■ Se dira que un hecho es cierto , cuando son favorables todos los casos posibles. Un 
ejemplo podrfa ser, el de comprar todos los billetes de un sorteo, por lo tanto sera un 
hecho cierto que ganara el sorteo. 

■ Llamaremos un hecho verosimil a un suceso susceptible de realizarse, pero su 
probabilidad favorable es menor que la unidad y mayor que 0,5. 

■ Si la probabilidad es igual a 0,5 sera un hecho dudoso , ya que las probabilidades 
ventajosas y desventajosas son iguales. Tal es el caso del lanzamiento de una 
moneda, en la aparicion de cara o sello. 

■ Hecho inverosimil, se presenta cuando la probabilidad es menor que 0,5 y mayor 
que cero. 

■ Hecho imposible , es cuando no existe posibilidad alguna de salir favorecido; por 
ejemplo el individuo que no compra loteria, la probabilidad que tiene de ganar sera 
cero. 


M todo empfrico O practico. Considera la probabilidad de un suceso, como aquel numero al cual se 
aproxima cada vez mas la frecuencia relativa de la ocurrencia de un suceso, cuando las veces que se 
repite el experimento que origina ese suceso es lo bastante grande. Este concepto tiene algo que ver con 
el experimento de Quetelet , en donde la probabilidad de un suceso tiende a estabilizarse en un punto, 
cuando el numero de experimentos se va haciendo cada vez mas grande. 
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P robdbiliddd empiricd , se determina mediante una serie de experimentos, en el caso de determinar 
la probabilidad de exito de una operacion quirurgica practicada por determinado medico, sera: numero 
de casos favorables, dividido por el total de operaciones practicadas. 


p _ Numero de casos favorables 
Numero de casos posibles 

Si lanzamos una moneda 10 veces, es posible que 8 sean caras y dos sellos, pero aqui hablamos 
de una moneda teorica, perfectamente equilibrada caera el mismo numero de caras y sellos, en nuestro 
ejemplo 5 caras y 5 sellos. Con un dado teorico, se tendra que la probabilidad de aparicion de cada cara 
sera 1/6. La probabilidad teorica se aplica a algo que no existe en la practica, pues en la vida diaria ve- 
remos que cuanto mayor sea el numero de lanzamientos de la moneda mas nos acercaremos al ideal. El 
numero de observaciones debe ser lo suficientemente grande, si se quiere una inferencia valida para ella. 


M todo clasico. Considera la probabilidad como el cuociente de dividir al numero de casos favorables 
o exitos que pueden ocurrir en una prueba, por el total de casos posibles y que anteriormente lo consoli- 
damos como empirico. 


p _ 

Numero de exitos 

r — 

Total de casos posibles 


P robdbiliddd a priori. Es aquella que se puede determinar de antemano, sin necesidad de realizar 
el experimento. Ejemplo: la probabilidad de que aparezca cara en el lanzamiento de una moneda, se sabe 
de antemano que es igual a 0,5. 

Probdbiliddd objetivd y subjetivd. Las probabilidades obtenidas mediante el metodo empirico y 
metodo clasico, comunmente se les denomina como probdbilidddes objet'lVdS , ya que se toma de la ex¬ 
perience, es decir, de las repeticiones del hecho. Sin embargo vale la pena aclarar que tambien existen 
las llamadas probdbilidddes SUbjet'lVdS correspondientes a una evaluacion muy personal de la ocurrencia 
del suceso, por ejemplo ^Perdera la seleccion del futbol en el proximo partido? /,Sacare mas de 4 en el 
proximo examen? etc. En ellos la persona fijara la probabilidad correspondiente dependiendo de su cri- 
terio personal. 


Probdbiliddd con bdse en Ids frecuencids reldtivds. Es otro concepto probabilistic, que consiste 
en una observacion que nos determina en que momento ocurrieron eventos semejantes en el pasado, que 
permitan establecer la probabilidad de que vuelva a ocurrir en el futuro. 


Probabilidad 

Numero de veces de ocurrencia del evento en el pasado 

de ocurrencia 

Numero total de observaciones 


Pruebd es Id redlizdcion de LW dCtO. El conjunto de pruebas realizadas en las mismas condiciones se 
denomina experimento. La respuesta de una prueba se llama resultado, punto muestrdl o suceso. El con- 
junto de todos los resultados posibles constituye un espdCIO muestrdl. Un evento es un conjunto de uno o 
mas puntos muestrales, por ejemplo, al lanzar un dado, se tendra, que 1, 2, 3, 4, 5, 6 son 6 elementos; si 
se pide la aparicion de un numero impar el evento estara constituido por: 1 3 5. 


ELABORACION DE ESPACIOS M UE ST RALES 

Hemos visto que los resultados posibles de un experimento se denominan puntos muestrdles y una lista de 
todos los resultados posibles de un experimento se denomina espdCIO muestrdl. Veamos varios ejemplos. 
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E jemplo 1. Experimento : elegir un alumno del curso de estadistica en la facultad. 
o 

(conjunto) => U { Acero, Alvarez, Cuellar... Serrano} 

E jemplo 2. Experimento : lanzamiento de una moneda teorica 

0 : U={C S} 

l h l h 

Ejemplo 3. Experimento : lanzamiento de dos monedas, asignando la probabilidad a cada suceso. 

0 : U={CC CS SC SS} 

Va Va Va Va 

Ejemplo 4 E xperi men to: lanzamiento detres monedas 

0 : U = {CCC CCS CSC SCC CSS SCS SSC SSS} 

Vs Vs Vs Vs Vs Vs Vs Vs 

Ejemplo 5. Experimento: lanzamiento de 4 monedas 
0 


U = 


cccc 


1/16 


CCCS 

ccss 

csss 

CCSC 

cscs 

scss 

CSCC 

cssc 

sscs 

SCCC 

scsc 

sssc 


sscc 



sees 


4/16 

6/16 

4/16 


SSSS^ 


1/16 


Observemos en el ejemplo 5, como se ordenan, cambiando la posicion de las apariciones de cara 
(C) y sello (S). La probabilidad de obtener exactamente tres caras, vemos que hay 4 resultados {CCCS, 
CCSC, CSCC, SCCC} sobre un total de 16 sucesos, por lo tanto su resultado sera de 4/16 = Va. 

El numero de casos posibles sera facil de determinar, si consideramos el lanzamiento de una mone¬ 
da, se obtienen dos sucesos y tendra como exponente el numero de lanzamientos, asi: 2 n . Observemos en 
los ejemplos anteriores: 2 3 4 y 5 el numero de sucesos posibles: 

2. 2 1 = 2 sucesos posibles 3. 2 2 = 4 sucesos posibles 

4. 2 3 = 8 sucesos posibles 5. 2 5 = 16 y asi sucesivamente. 

Ejemplo 6. Experimento: lanzamiento de un dado teorico 

(conjunto) U = { 1 2 3 4 5 6} 6 n —>6 X = 6 sucesos posibles 

1/6 1/6 1/6 1/6 1/6 1/6 
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Ejemplo 7. ExperimentO : lanzamiento de dos dados 


o 


II 

12 

13 

14 

15 

16 

21 

22 

23 

24 

25 

26 

31 

32 

33 

34 

35 

36 

41 

42 

43 

44 

45 

46 

51 

52 

53 

54 

55 

56 

61 

62 

63 

64 

65 

A 

SO 

SO 


6 2 = 36 sucesos posibles 
La probabilidad de presentacion de 
cada suceso = 1/36 

= paricion de (66) 


Ejemplo 8. ExperimentO : lanzamiento de tres dados 
o 

6 3 = 216 sucesos posibles; la probabilidad de cada suceso = 1 / 216 
Ejemplo . ExperimentO: extraer una carta de una baraja de 40 cartas 


o 


Copas 

=> AS 

2 

3 

4 

5 

6 

7 

Zota 

Caballo 

Rey 

Oros 

=> AS 

2 

3 

4 

5 

6 

7 

Zota 

Caballo 

Rey 

Espadas 

=> AS 

2 

3 

4 

5 

6 

7 

Zota 

Caballo 

Rey 

Bastos 

=> AS 

2 

3 

4 

5 

6 

7 

Zota 

Caballo 

Rey suceso 1/40 


Ejemplo 10. ExperimentO: extraer una carta de la baraja espanola (52 cartas) 
o 


Diamantes 

=> AS 

2 

3 

4 

5 

6 

7 

8 

9 

10 

J 

Q 

K 

Corazon 

=> AS 

2 

3 

4 

5 

6 

7 

8 

9 

10 

J 

Q 

K 

Trebol 

=> AS 

2 

3 

4 

5 

6 

7 

8 

9 

10 

J 

Q 

K 

Picas 

=> AS 

2 

3 

4 

5 

6 

7 

8 

9 

10 

J 

Q 

K 


Diagrama del arbol. Es una de las maneras que permite determinar diversos eventos posibles, al contar 
los puntos muestrales. Veamos dos ejemplos. 

Ejemplo 11. En el lanzamiento de tres monedas, se tendra: 



CCC => (1/2) (1/2) (1/2) = 1/8 
CCS => (1/2) (1/2) (1/2) = 1/8 
CSC => (1/2) (1/2) (1/2) = 1/8 
CSS => (1/2)(1/2)(1/2) = 1/8 
SCC => (l/2)(l/2)(l/2) = 1/8 
SCS => (1/2) (1/2) (1/2) = 1/8 
SSC => (1/2) (1/2) (1/2) = 1/8 
SSS => (1/2) (1/2) (1/2) = 1/8 
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E jemplo 12. Lanzamiento de tres dados 


l°Lanzamiento 


2° Lanzamiento 



3° Lanzamiento 
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NOta: Cada uno de los puntos muestrales se ramifica tal y como lo hicimos con el suceso 3. 


E speranza matematica. Si P es la probabilidad de exito de un suceso en un solo 
ensayo, el numero de sucesos o la esperanza de ese suceso en n ensayos, estara 
dado por el producto de n y la probabilidad de exito p. 


E = np 


E jemplo 13. En el lanzamiento de dos dados 900 veces, ^cual es la esperanza de que en la suma de sus 
caras se obtenga un valor menor a 6? 


Primero obtenemos la probabilidad de exito que el suceso sea un valor menor a 6 en un solo ensayo: 

10 


(1,1) (1,2) (2,1) (2,2) (2,3) (3,2) (1,3) (3,1) (4,1) (1,4) 


P ~ 36 


Como se lanza el dado 900 veces, se obtiene que: E = np = 900 ( )= 9999 = 250 

\ 36 / 36 

Se espera que 250 de los 900 lanzamientos, la suma de sus caras resulte un valor menor a 6. 

Ejemplo 14. Lanzamiento de tres monedas, ^Cual es la esperanza de la aparicion de caras por lanza¬ 
miento? 


E = np = 3(l/2) = 1,5 

i“ = - E V«. = -^r-= 1 -5 


X 

1 

p 

r (x) 

*P(X) 

0 

1/8 

0 

1 

3/8 

3/8 

2 

3/8 

6/8 

3 

1/8 

3/8 

I 

8/8 

12/8 


8 


El resultado de 1,5 es el numero esperado de caras por lanzamiento. 
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EJERC 1C IQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lmea SIL. 

1. Las caras de un dado comun se hallan numeradas de 1 a 6. 

a) ^Cual es la probabilidad de que habiendose lanzado el dado, aparezca en la cara superior un 
valor par? 

b) ^Cual es la probabilidad de obtener un numero mayor a dos? 

2. /,Cual es la probabilidad de que al lanzar dos dados comunes, se presenten dos valores tales que la 
suma sea. a) 3? b) 4? 

3. /,Cual es la probabilidad de que al lanzar tres monedas: 

a) ^Todos sean caras? b) ^Que dos sean caras? c) ^Que dos sean sellos? 

4. ^Cual es la probabilidad que sean varones, los tres hijos de una familia? 

5. /,Cual es la probabilidad, en la experiencia de lanzar dos dados, uno bianco y otro rojo, de obtener? 

a) Primero, construir un espacio muestral 

b) <^Que en uno de ellos se presente el 4 y en el otro un valor menor a 4? 

c) Obtener en el dado bianco un numero menor de tres y en el dado rojo, un valor mayor a tres? 

d) La suma de las dos caras resulte un valor de: 6; 8; 7; mas de 9. 

6. Si se tienen 2 lapices uno rojo y otro verde, cuyas caras estan numeradas 1, 2, 3, 4 y se hacen rodar 
sobre el piso, leyendo los numeros correspondientes a sus caras superiores. Con lo anterior: 

a) Establezca el espacio muestral de los acontecimientos. 

b) Determine la probabilidad de que la cara superior del lapiz rojo sea 16 3, mientras que la de 
verde sea 2 6 4. 

c) /,Cual es la probabilidad de que la suma de sus caras sea 4? 

d) ^Que la suma de sus caras, sea un numero par? 

7. Suponga que agrega un lapiz azul al ejercicio anterior. ^Puede establecer un espacio muestral? Si 

es asi, determinelo: 

a) ^Cual es la probabilidad de que exactamente una de las caras expuestas presente el numero dos? 

b) Hallar la probabilidad correspondiente a que exactamente dos de las caras expuestas presenten 
el numero dos. 

c) Que las tres caras presenten el numero dos. 

8. Tres corredores A, B y C compiten entre ellos frecuentemente; han ganado el 60, el 30 y el 10 por 
100 de las competiciones respectivamente. En la proxima carrera: 

a) /,Cual sera el espacio muestral? 

b) <^Que valores podriamos asignar a los puntos muestrales? 

c) ^Cual es la probabilidad de que A pierda? 

9. Despues de un extenso estudio, los archivos de una compama de seguros revelan que la poblacion 
de un pais cualquiera puede clasificarse, segun sus edades, como sigue: un 35 por ciento menores de 
20 anos, un 25 por ciento entre 21 y 35 anos, un 20 por ciento entre 36 y 50 anos, un 15 por ciento 
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entre 51 y 65 anos y un 5 por ciento mayores de 65 anos. 

Suponga que se puede elegir un individuo de tal manera que cualquier habitante del pais supuesto 
tenga la misma posibilidad de ser elegido. Empleando la anterior informacion, describir un espacio 
muestral para la edad del individuo elegido y asignar valores a los puntos muestrales. /,Cual es la 
probabilidad de que el individuo elegido sea mayor a 35 anos? 

10. Un embarque de pintura contiene 2.000 latas de 5 kilos, de las cuales 800 son de pintura blanca, 500 
de amarilla, 300 de roja, 300 de verde y 100 de azul. Durante el viaje, las latas se han sumergido 
accidentalmente en agua y se han borrado todos los rotulos. A la llegada, las latas se colocan sobre 
una plataforma, se coge una y se abre. Respecto del color de la lata elegida: 

a) ^Cual es el espacio muestral? 

b) ^Que valores podrian asignarse a los diversos puntos muestrales? 

c) ^Cual es la probabilidad de que la lata elegida contenga pintura roja, blanca o azul? 

11. Suponga que el observatorio meteorologico clasifica cada dia segun las condiciones del viento como 
ventoso o en calma; segun la cantidad de lluvia caida, en humedo o seco y segun la temperatura 
como caluroso, normal o frio. ^Que espacio muestral es necesario para caracterizar un dia? <^Que 
valores se pueden asignar a los puntos muestrales? 

12. En una urna que contiene cuatro bolas blancas y dos rojas. 

a) ^Cual es el espacio muestral? 

b) ^Que valores parecen razonables para los puntos muestrales? 

c) /,Cual es la probabilidad de sacar una bola roja? 

13. Si se lanzan 3 dados, encontrar la probabilidad de que: 

a) Los 3 presenten un cuatro. 

b) Los 3 presenten, el mismo numero. 

c) Dos dados presenten el cuatro y el tercero cualquier otro numero. 

d) Solo dos dados tengan el mismo resultado. 

14. Tenemos en una caja 3 bolas azules, 2 blancas, 6 negras y 5 verdes. ^Que probabilidad hay de ganar 
o perder, si las premiadas son las blancas y azules? 

15. Un experimento consiste en seleccionar una ficha de una caja que contiene 6 de ellas numeradas del 
1 al 6. Dadas las siguientes descripciones, establecer cuales son espacios muestrales adecuados al 
experimento considerado. 

a) U = [ 1, 2, 3, 4, 5, 6] b)U=[l, 2, 3, 4, 5] 

c ) U = [N° par, N° impar] d)U=[l, 3, 5, N° par] 

e) U = [1, 2, N° menor que 6, 6] f) U = [N° menor que 3, 3, N° mayor que 3] 

16. Se elige un comite de 3 miembros entre 6 candidatos A B C D E y F. 

a) Especificar el espacio apropiado y asignar adecuadamente probabilidades a los sucesos 
elementales del espacio muestral. 

b) Hallar la probabilidad de que se elija A 

c) Hallar la probabilidad de que A y B sean elegidos. 

d) Hallar la probabilidad de que A o B sean elegidos. 

e) Hallar la probabilidad de que A no sea elegido 

f) Hallar la probabilidad de que ni A ni B sean elegidos 
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17. ual es la probabilidad que una bola, extraida al azar, de una uma que contiene tres bolas rojas, 
cuatro blancas y cinco azules, sea blanca? 

18. En una encuesta a familias con dos ninos, se registra el sexo de cada nino segun el orden de sus 
nacimientos. Por ejemplo, si el primer nino es varon y el segundo es mujer se anotara: HM. Esto es 
un punto del espacio muestral. Listar los demas puntos muestrales. 

19. Supongamos que la encuesta del ejercicio anterior, se realice a familias con 3 hijos. 

a) Listar un espacio muestral apropiado 

b) /,Cuantos puntos tendra dicho espacio? 

c) /,Cuantos de tales puntos corresponden a familias con dos hijos hombres y una mujer? 

d) ^Cuantas familias en las que el primer hijo nacido sea mujer? 

20. Asignando la misma probabilidad a cada uno de los puntos del espacio muestral del ejercicio 
anterior. 

a) ^Cual es la probabilidad de que en una familia con 3 hijos los dos primeros sean mujeres y el 
tercero hombre? 

b) ^Cual es la probabilidad de que dos sean mujeres y uno sea hombre? 

21. Una persona guarda en su bolsillo una moneda de $50, una de $100, otra de $200 e imaginemos una 
cuarta de $500. Si esa persona toma sucesivamente (una despues de la otra) dos monedas, describir 
un espacio muestral apropiado. 

22. Se lanzan dos dados correctos. Calcular la probabilidad del suceso, “los numeros obtenidos no 
suman 4”. 

23. A continuacion se mencionan algunos experimentos aleatorios. En cada uno de los casos se pide 
describir un espacio muestral. 

a) Se extrae una carta de una baraja espanola (40 cartas) y se anota la carta escogida. 

b) Se lanzan 6 monedas y se observa la aparicion de caras y sellos. 

c) Un joven tiene en su bolsillo 4 billetes: de $100, de $200, de $1,000 y de $10,000 pesos. Saca, 
uno tras otro, dos billetes. 

d) Los socios de un club eligen un comite de tres miembros entre los seis candidatos A, B, C, D, E y F. 

24. Suponga tres figuras de 4 caras, numeradas del uno al cuatro. Al ser lanzadas al aire, y luego 
observados los numeros que aparecen en la cara superior, se pide: 

a) Elaborar un espacio muestral. 

b) Utilizando la regia del exponente, hallar el numero de eventos posibles. 

c) Determinar la probabilidad de obtener exactamente un dos; exactamente dos dos; exactamente 
tres dos. 

25. La probabilidad de que en un dia cualquiera llueva, es del 20%. ^Cual es la probabilidad de que 
llueva? ^Que no llueva? 

26. Al lanzar un par de dados correctos, ^cual es la probabilidad de que: 

a) Ambos dados presenten el numero tres? 

b) Ambos presenten numeros impares? 
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c) La suma de sus caras sea un numero impar? 

d) En uno de ellos aparezca el 3 y en el otro el 6? 

e) En el primero aparezca el 3 y en el segundo el 6? 

27. Si se lanza un dado correcto, ^cual es la probabilidad de obtener un numero? 

a) Par b) Impar c) Mayor que 0 d) Menor que cinco 

28. Si se lanzan tres monedas, ^cual es la probabilidad de obtener: 

a) exactamente una cara? b) por lo menos dos caras? 

c) exactamente dos caras? d) como maximo tres caras? 

29. a) ^Que es un evento? 

b) Si se tiene una baraja de 52 cartas al sacar una K, ^cual sera el evento de interes? y ^cuales son 
los puntos muestrales de ese evento? 

c) ^Cual es la probabilidad, al extraer una carta de una baraja de 52, de obtener una figura (K, Q, J)? 

30. Suponga que en un grupo (curso) de alumnos, se van a seleccionar 3 de ellos con el fin de observar, 
si trabajan (A) o no trabajan (B) 

a) Enumerense los elementos del espacio muestral, con los tres alumnos seleccionados. 

b) Enumerense los elementos en el suceso de que el numero de alumnos que trabajan sea cero. 

c) ^Como podria definir usted el suceso {AAB, ABA, BAA}? 


31. Explique brevemente que es: 
a) Probabilidad a priori 
c) Espacio muestral 
e) Probabilidad subjetiva 
g) Prueba 


b) Probabilidad empirica 

d) Diferencia entre posibilidad y probabilidad 

f) Experimento 
h) Evento 


32. Estime la probabilidad de que su equipo favorito sea uno de los 4 primeros en el campeonato del ano 
entrante ^En que factores se basa para hacer dicha estimacion? ^Como llamaria esta probabilidad? 


33. De un ejemplo de probabilidad subjetiva y otra de probabilidad objetiva. 

34. Hay dos reglas que se aplican a los espacios muestrales: (a) Cada resultado posible del experimento 
debe corresponder a un punto muestral. (b) Analizando el espacio muestral correspondiente al lanzar 
un dado: aparece un numero par, aparece un numero impar. 

En ambos casos a) y b), conteste si es cierto o falso, la aplicacion de esas reglas. 


E speranza matematica 


35. Se propone un juego de dados, en las siguientes condiciones: si sale el “uno” gano $5,000, pero si 
sale cualquier otro numero pierdo $1,000. ^Debo aceptar esa propuesta? 

36. En una urna hay 50 sobres, de los cuales, 10 contienen $5,000, 10 contienen $1,000 cada uno y el 
resto esta vacio, ^Cual es la esperanza obtenida al sacar un solo sobre? 

37. Una persona saca sucesivamente tres bolas, sin reposicion, de una urna que contiene 8 bolas negras, 
8 blancas y 8 rojas. Si recibe $5,000 si no saca ninguna bola negra ual es su esperanza? 
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38. Una compama dispone de 7 obreros calificados para operar una maquina que requiere 3 obreros en 
cada tumo. 

a) ^Cuantos tumos son disponibles? 

b) ^En cuantos de estos tumos aparecera uno cualquiera de tales obreros? 

39. El numero de accidentes que ocurren en una determinada esquina los dias viernes entre las 5:30 y 
las 6:30 p.m. pueden ser: 0, 1, 2, 3 6 4; con probabilidades asociadas iguales a 0,90, 0,04, 0,03, 
0,02 y 0,01. 

a) Halle el numero esperado de accidentes, durante dicho periodo. 

b) Durante 200 perfodos como el que se considero. 

40. Aseguro mi automovil contra el riesgo de robo en la suma de $850,000. Si la probabilidad de que 
sea robado en el curso de un ano es 0,04 ^cual es el precio justo de la prima anual que debo pagar? 

REGLADE MULTIPLICACION, 

PERMUTACIONESY COMBINACIONES 


Hemos visto como el didgramd de arbol nos ayuda a establecer los puntos muestrales, y tambien puede 
ser utilizado en aquellos experimentOS COmpuestOS, que puede resultar tedioso, sobretodo cuando el 
numero de resultados posibles o el numero de etapas es bastante grande. La regia de multiplicacion, la 
aplicacion de las permutaciones y combinaciones, evitan en muchos casos trazar un diagrama de arbol. 
Veamoslo: 

Regia de multiplicacion 

Algunos de los problemas de probabilidad tienen solucion a traves de la aplicacion de la regia de 
multiplicacion. 

Ejemplo 1. Una persona vive en el extremo norte de la ciudad y solo cuenta con dos rutas para poder 
llegar a la llamada Autopista Norte. Una vez alcanzada la autopista tiene tres rutas de menor congestion 
para llegar al centro de la ciudad. Ya en el centro puede seleccionar dos rutas para llegar al parqueadero 
mas cercano a su oficina. La pregunta que se haria dicha persona es: ^de cuantas maneras o mtas podria 
conducir su automovil de la casa al parqueadero mas proximo a la oficina? 

o 


1 3 6 



Las alternativas que tendra son: 

{1,3,6} {1,3,7} {1,4,6} {1,4,7} 

{2,3,6} {2,3,7} {2,4,6} {2,4,7} 


{1,5,6} {1,5,7} 
{2,5,6} {2,5,7} 
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En total se tienen 12 maneras o rutas para elegir. Aplicando la tecnica de la multiplicacion, se ten¬ 
dra: 2x3x2 = 12. 


Para el total de arreglos que se pueden hacer, la formula general es: Total arreglos posibles = m . n 
Si tenemos por ejemplo cuatro eventos sera igual: 


m x n x o x p 


Ejemplo 2. En el experimento de lanzar una moneda y a la vez un dado ^cual es el numero de puntos 
muestrales? 


o 

En el primer caso (moneda) son 2 y en el dado son 6 las posibilidades por lo tanto el numero de 
puntos muestrales del experimento compuesto es 2 x 6 = 12 

Ejemplo 3. Supongamos que se va a extraer una carta en una baraja de 52 cartas ^Cuantos puntos 
muestrales tendra un experimento compuesto (a) si despues de extraer una carta, se vuelve al mazo y 
luego se extrae otra carta? (b) si luego de extraer una carta, esta se deja por fuera y luego se extrae otra 
segunda carta? 

o 

a) En la primera se tienen 52 cartas y como inmediatamente se devolvio, la que se extrajo en la 
segunda se tendran otra vez las 52 cartas, por lo tanto el total de puntos muestrales sera: 52 x 52 
= 2.704 

b) En la primera extraccion se tendran 52 puntos, pero en la segunda no se devolvio la carta, solo 
hay 51 puntos, en este caso sera: 52 x 51 = 2.652 puntos muestrales. 

Ejemplo 4. Se lanzan tres dados (a) ^Cuantos puntos muestrales se tiene? (b) ^Cual es la probabilidad de 
obtener un 2 en uno de los dados? (c) Que aparezca un 2 en el primer dado (d) De obtener exactamente 
dosd 2. 

o 

a) Se tendra 216 puntos muestrales 6 3 = 216. 

b) En total se obtiene 77 resultados, la probabilidad sera: 77/216 

c) Si tiene 36 casos posibles, la probabilidad sera: 36/216 

d) Son 15 los casos posibles, la probabilidad sera: 15/216 

Permutacionesy combinaciones 

La regia de la multiplicacion es la base de dos formulas que nos permiten simplificar en forma considerable 
el conteo de puntos muestrales, siendo ellas las permutaciones y las combinaciones. 

Se puede decir que las permutaciones es una forma de ordenar o arreglar la totalidad de los ele- 
mentos de un conjunto; tambien se puede considerar como un conjunto de cosas extraidas en un orden 
especifico y sin reemplazo de un conjunto igual o mayor. 

Generalmente simbolizado por P n = n! o como n P n = n! 

Lo anterior se lee como “permutaciones de n elementos tornados de n en n” 

El shnbolo n! se lee como n factorial, consideremos el ejemplo de 8! 
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o 

81 = 8x7x6x5x4x3x2x1 Tambien se puede escribir a: 81 = 8x7x6x5! 


Ejemplo 1. Supongamos que se tienen los siguientes numeros naturales 1, 2, 3, 4 y se quiere formar 
cifras de 4 dfgitos. Segun la formula anterior se tendra que 4 P 4 = P 4 = 4!=4x 3x 2x 1=24. Veamos 
cuales serfan esas cifras: 


1234 

1243 

1324 

1342 

1432 

1423 


2134 

2143 

2314 

2341 

2413 

2431 


3142 

3124 

3214 

3241 

3412 

3421 


4132 

4123 

4213 

4231 

4312 

4321 



P = 4! = 24 cifras 

4 


Ejemplo 2. En la primera linea del salon de clases se tienen colocados 8 pupitres y se quiere sentar a 8 
alumnos; ^de cuantas maneras se podran colocar? 

o : /s = = 8- = 40.320 maneras 

Ejemplo 3. Con las letras de la palabra PALO, ^cuantas palabras se pueden formar? 


PALO 

APLO 

LPAO 

OPAL 

PAOL 

APOL 

LPOA 

OPLA 

PLAO 

AOPL 

LOPA 

OLAP 

PLOA 

AOLP 

LOAP 

OLPA 

POLA 

ALOP 

LAPO 

OALP 

POAL 

ALPO 

LAOP 

OAPL 


P 4 = 41=4x3x2x1 = 24 palabras 
Pn = n\ 


Cuando uno o varios elementos estan repetidos, el calculo de las permutaciones varia: en este caso 
nos referimos a Permutaciones con repeticidn ; por ejemplo con la palabra CASA tendriamos un numero 
de palabras inferior a 24, en el caso de que no se haga distincion de la A. 


CASA 

ACSA 

SCAA 

CSAA 

AACS 

SAAC 

P = — 

CAAS 

ACAS 

SACA 

ASAC 

AASC 

ASCA 

Mr) r j 


La formula que se debe aplicar es: P {r 2) =-j =^j X ^^ -\2 palabras 


Las permutaciones con repeticidn , r son un caso particular de las variaciones y no existe una ley 
sencilla para su formacion. Dado lo complicado del sistema, solamente se presenta la formula con la 
cual se logra obtener el numero de esta clase de permutaciones. Sean los elementos aa - bbb - cc - d 
para permutar con repeticidn. Tendremos 8 elementos repartidos asi: dos del primero, tres del segundo, 
dos del tercero y uno del cuarto, entonces las permutaciones se presentan asi: P 8(r . 2 3 2 i) y l a formula 
sera: 


8 ! 


8x7x 6x5x4 x-3T 


L n(r: 2,3,2,1) 


2! 3! 2! 


= 1.680- 


p 

m 

r n{r. 

r '- r ^ ~ r x \ r 2 \ 


2 x 1 x^x 2 x 1 
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E jemplo 4. e cuantas maneras distribuiriamos 3 monedas de $50 y 4 monedas de $100 en una misma 
linea? 

7! 

O : Pi(r.3, 4) = 3^41 = 35 maneras 


E jemplo 5. /,Cuantos grupos de 6 letras se pueden formar con las letras de la palabra Amigas? 

6 ! 

o : ^ 60 : 2 ) - 2 ^ - 360 grupos de letras 


Ejemplo 6. ^Cuantas palabras se pueden formar con las letras de la palabra Barranquilla? Primero 
contamos el numero de letras, para determinar el valor de n, en este caso n = 12 ; luego las letras repetidas; 
A se repite 3 veces (r = 3); R dos veces ( r 2 = 2) y la L dos veces ( r 3 = 2). Aplicando la formula se tendra: 


12 ! 


12x11x10x9x8 x7x6x5x4 


[ 120 : 3 , 2 , 2 ) 


3! 2! 2! 


2?rx 2xlx 2x1 


= 19.958.400 palabras 


En las permutaciones cuando no se utilizan todos los elementos, sino una parte de ellos, algunos lo 
denominan como variaciones , cuya formula esta dada asi: 



E jemplo 7. Volvamos nuevamente a los cuatro numeros naturales: 1 , 2 , 3, 4 del ejemplo 1 y formemos 
cifras de tres digitos, con los siguientes resultados: 


o 


123 

213 

312 

413 

132 

231 

321 

431 

124 

214 

314 

412 

142 

241 

341 

421 

134 

234 

342 

423 

143 

243 

324 

432 


4 4 

4 Pn =-= — = 24 cifras 

4 3 4-3 1 


Ejemplo 8. Si ahora se quieren formar cifras de dos digitos, se tendra: 


o 


12 

21 

31 

41 

13 

23 

32 

42 

14 

24 

34 

43 


4 4 ?4 

4 P 2 = -= — = = 12 cifras 

4 2 4-2 22 


Ejemplo . Si en el ejemplo 2 de los 8 pupitres colocados en la primera linea del salon se quiere 
determinar de cuantas maneras podemos ordenar a 5 alumnos, se tendra: 

p -_- _ - x7x6x5x4x3 _ 6 7 20 maneras 

8 5 -5 3 3 

Combinaciones. Son un arreglo de los elementos sin importar el orden en que se dispongan. 
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La formula que se utiliza en el calculo de las combinaciones es: 


( n—r)\ r ! 


E jemplo 10. Cambiemos el ejercicio de los 4 numeros naturales por las primeras cuatro letras del alfabeto 
A, B, C, D. Si se desea combinarlos, ^cuantas combinaciones se podran hacer? 

o 


Una sola combinacion, ya que al no importar el orden de colocacion da lo mismo 
ABCD = ADBC = ACBD = CB AD = DACB = etc. 

^ 4 4 4 i 

4 C 4 - 4 _ 4 4 - oi: - tt = 1 combinaci6n 

E jemplo 11. Si se fueran a combinar esas 4 letras de dos en dos, se tendrfa: AB = BA AC = CA 
BC = CB BD = DB CD = DC AD = DA 

4 

Se pueden combinar de 6 maneras: 4 C 2 = ——-—— — 6 

E jemplo 12. En este mismo ejercicio nos pidieran que combinaramos las letras de 3 en 3, el resultado 
serfa: 


ABC 

= 

BCA = 

CBA = 

ACB = 

BAC = 

CAB 

ABD 

= 

ADB = 

BDA = 

BAD = 

DAB = 

DBA 

ACD 

= 

ADC = 

CAD = 

CDA = 

CDA = 

CAD 

BCD 

=z 

BDC = 

CBD = 

CDB = 

DBC = 

DCB 


En total se puede combinar de 4 maneras. Mediante la aplicacion de la formula se tendra: 


r — _-_= = 4 

4 3 4-3 3 1 3 


C =--- 

n r (n—r)\ r ! 


r " ■ 

APLICACION DE LA CALCULADORA 


A 


Los calculos anteriores, para determinar el total de puntos muestrales que tenga el experimento, se 
pueden agilizar mediante el uso de la calculadora. La mayoria de ellas tienen en sus teclas la indicacion 
correspondiente, si se trata de permutaciones aparece n P r y en las combinaciones n C r algunas implican 
una vez digitado el valor de n, oprimir la tecla SHIFT y luego el valor de r, de esta forma se obtiene el 
resultado respectivo: 


C =- — - 

n r (n—r)\ r ! 


c - J2_-210 

loC 6 "4 6 


1 „P 6 = ^- = 151 200 


En la calculadora CASIO fx 5.000F, las formulas estan incorporadas asi: con 12 y luego la tecla 
FMLA aparece la formula para el calculo de las permutaciones y con la cifra 13 y FMLA se obtiene 
la correspondiente a las combinaciones. 




J 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor madon 
en Lfnea SIL. 

41. En una Universidad de Bogota a 5 estudiantes se les califica con las letras A, B, C, D. E. /,De 
cuantas maneras se les puede calificar, si los estudiantes obtienen todos calificaciones diferentes? 

42. Si un futbolista conoce 7 jugadas diferentes y si el entrenador le instruye para que juegue las 7 sin 
que ninguna se repita, ^que libertad le queda a ese jugador? 

43. Una senora invita a cenar a 8 amigos y despues de sentarse ella, ^De cuantas maneras se pueden 
sentar sus invitados? 

44. ^Cuantas permutaciones se pueden hacer con las letras: A 2 B 1 B 2 ? 

45. ^Cuantas cifras de 9 digitos se pueden formar con los digitos del 1 al 9? 

46. Un examen consta de cuatro preguntas y se deja libertad para contestarlas en el orden que se desee. 
lX>Q cuantas maneras se podra contestar? 

47. ^Cuantas palabras de 5 letras, con o sin sentido idiomatico pueden fomarse a partir de las letras de 
la palabra COSER? 

48. /,Cuantas permutaciones pueden efectuarse con las letras A, B, C? 

49. /,Cuantas permutaciones se pueden hacer con las letras de la palabra MISSISSIPPI? 

50. a) ^Cuantas permutaciones se pueden hacer con las letras de la palabra COOPERADOR? 
b) ^Ahora, si se considera que las O deben estar juntas? 

51. ^Cuantas permutaciones se pueden hacer con las letras: A A B 1 B 2 B 3 ? 

52. ^Cuantas permutaciones se pueden hacer con las letras: A A B B B? 

53. ^De cuantas maneras se pueden ordenar en un estante con 5 litros de whisky y tres botellas de 

aguardiente, a condicion de que dos litros de whisky esten siempre juntos y dos botellas aguardiente 
siempre juntas? 

Permutaciones (Variaciones) 

54. Si un estudiante tiene 9 libros y desea ordenar 5 de ellos sobre un estante. ^De cuantas maneras 
distintas puede hacerlo? 

55. /,Cuantos numeros de 4 digitos pueden formarse con los digitos: 1, 3, 5, 7, 8 y 9. si ninguno puede 
aparecer mas de una vez en cada numero? 

56. ^Cuantas palabras de cinco letras diferentes se pueden formar con las 27 letras del alfabeto? 
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57. ^Cuantos numeros de tres cifras se pueden formar con los dlgitos: 2, 3, 4, 5, 6? 

58. /,Cuantas senales diferentes se pueden formar con 10 banderas distintas, levantando al menos 3 y 
no mas de 6 banderas en una driza de un mastil? 

59. i De cuantas maneras diferentes se puede contestar un examen de 5 preguntas, si solo hay que dar 
respuesta a 3 de ellas? 

60. /,Cuantas ordenaciones diferentes de diez letras se pueden hacer utilizando la palabra 
CON VENCION ? 

61. Determine el valor para cada uno de los siguientes casos: a) 6! b) 10! c) 3! d) 0! 

62. a) ^Cuantos numeros de tres dlgitos pueden formarse con 1, 2, 3, 4, 5, 6, 7, 8? 

b) ^Cuantas cifras de 4 dlgitos? 

c) ^Cuantas cifras de 5 dlgitos? 

63. ^Cuantas permutaciones se pueden obtener con las letras de la palabra CARRASQUILLA? 

64. Si consideramos un alfabeto con 26 letras ^cuantas placas de tres letras se pueden elaborar, si una 

letra no debe aparecer mas de una vez?; b) ^Cuantas placas se tendran, si las letras pueden aparecer 
mas de una vez? 

65. Un mecanico contratado para arreglar una maquina, cree que hay posiblemente 4 causas y se le 

propone dar solucion a cada una de ellas, senalandolas por A, B, C, D 

a) Enumerese el orden que podrfa dar a las soluciones. 

b) Aplicando la formula correspondiente ^de cuantas maneras se pueden permutar? 

66. Si consideramos el actual campeonato de balompie conformado por 16 equipos: 

a) iX>q cuantas maneras se podran clasificar, suponiendo que no hay empates? 

b) Si solo consideramos los 4 primeros puestos, ^cuantas clasificaciones diferentes se pueden hacer? 

67. ^De cuantas maneras posibles se pueden ordenar en una biblioteca 3 libros de matematica y dos de 

estadistica, se fija como condicion que los libros de matematica esten siempre juntos, lo mismo que 
las estadisticas? 


68. Un joven ha invitado a 6 amigos a comer. Despues de sentarse el ^de cuantas maneras diferentes 

pueden sentarse los amigos? 

69. Obtener los resultados para los siguientes: a) 6 P 2 b) 4 P { c) 12 P 5 d) P 6 e) P g 

Combinaciones 


70. Desarrolle las siguientes combinaciones: 


r\ 

5 \ 

5 \ 

S \ 

M 

M 

a) 6 

b) 3 

c) 2 

d) 2 

e) 4 

0 6 


^Observa algo especial en el desarrollo de los ejercicios anteriores? ^Por que se dan esos resultados 
iguales? 
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71. ^De cuantas maneras puede formarse un equipo de balompie (bajo el supuesto que pueden jugar en 
cualquier puesto) entre un plantel de 30 jugadores? 

72. <d3e cuantas maneras sepuede organizar una familia de 5 hijos, si desea que dos sean ninas y tres ninos? 

73. ^Cuantas comisiones de 6 personas pueden formarse con un grupo de 10 personas? 

74. Supongamos que Pedro, Maria, Grisel, Juan y Jorge son los candidatos para conformar un comite, 
compuesto de tres personas, a) /,Cuantos comites de tres personas se pueden conformar?; b) Grisel 
y Juan, por ser hermanos, no deben estar juntos en los comites. 


75. A1 desarrollar las siguientes combinaciones, ^que observa usted en los resultados? 


a) 





76. ^Cuantos comites diferentes de 4 personas se pueden formar a partir de un grupo de 12 personas? 

77. a) Suponga que en el ejercicio anterior el comite de 4 personas tiene que estar conformado por una 

mujer y 3 hombres. 

b) Si el grupo esta conformado por 4 mujeres y 8 hombres, 

^En los dos casos, de cuantas maneras diferentes los podemos organizar? 


78. ^Cuantos grupos de 7 cartas, pueden obtenerse de una baraja de 40 cartas? 


79. /,Cuantos comites diferentes pueden seleccionarse entre 7 hombres y 4 mujeres si deben constituirse de: 

a) 3 hombres y 2 mujeres 

b) 5 personas de las cuales por lo menos tres deben ser hombres. 


80. Es necesario elegir un comite de 10 personas entre 6 abogados, 8 economistas y 5 ingenieros. Si el 
comite debe estar integrado por 4 abogados, 3 economistas y 3 ingenieros. 


81. ^Cuantos comites compuestos de 3 diputados y 5 senadores pueden formarse tomando como base 
un grupo de 5 diputados y 8 senadores? 

82. a) ^Cuantas comisiones de 3 personas se pueden formar seleccionandolas de entre 10 personas? 
b) ^Comisiones de 7 personas entre 10? 


83. ^Cuantos grupos de cinco cartas se pueden obtener de una baraja de 52 cartas? 


84. ^De cuantas maneras se pueden extraer dos manzanas de una caja que contiene 8 manzanas? 

85. Una caja contiene 7 fichas rojas, 6 fichas blancas y 4 fichas azules. ^Cuantas selecciones de 3 fichas 
se pueden formar si: 

a) las 3 deben ser rojas? 

b) ninguna puede ser roja? 


86. Un examen consta de 4 preguntas, hay que dar respuesta a solo 3 de las 4 preguntas, ^Cuantos 
examenes de diferente contenido habra que corregir como maximo? 
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ALGUNAS REGLAS BASICAS DE PROBABILIDAD 

Clases de sucesos. Es necesario primeramente considerar varias clases de sucesos: 

■ Sucesos igualmente probable: lanzar una moneda, aparicion de cara o sello. 

■ Sucesos opuesto 0 contrario: siendo aquellos que se complementan basicamente. 

■ Sucesos ciertOS: una moneda con dos caras. 

■ Sucesos imposibles: lanzar un dado y que aparezca en la cara superior un 8. 

■ Sucesos compatibles: que puede suceder en una baraja, aparezca simultaneamente 
un seis y que sea oros. 

■ Sucesos mutuamente excluyentes: al lanzar un dado, aparece un dos o un seis. 

■ Sucesos independientes: al lanzar dos dados, obtener en el primero un dos y en el 
segundo, un seis. 

■ Sucesos dependientes: la ocurrencia de uno afecta la ocurrencia del otro. 

Para facilitar el calculo de las probabilidades se emplean algunas reglas como se veran a continuacion. 


REGLADE ADICION 

o t a t t 

Si dos o mas sucesos son tales, que solamente uno de ellos puede ocurrir en un solo ensayo, se dice que son 
mutuamente excluyentes. Se denomina probabilidad aditiva y sera igual a la suma de las probabilidades 
de cada suceso. 


p= p,+ p 2 + p 3 +.+ p„ 


Consideremos que p v p v p v . p n son las distintas probabilidades de n sucesos mutuamente ex¬ 

cluyentes, la probabilidad (P) de que uno de estos sucesos se presente en un solo ensayo , estara dada por 
la suma de las probabilidades para cada suceso 


p = Pi + p 2 + p 3 + .+ p„ 


De acuerdo a lo anterior, mutuamente excluyente significa que solamente un solo suceso o evento 
puede ocurrir, o sea que los demas no se pueden presentar al mismo tiempo. La formula anterior la po- 
demos expresar de una manera mas facil y entendible: 


Tambien se presenta como: 


P (A 6 B) = P (A) + P (Bj 


p = p + p + p 

' (AoBoC) ' (A) (B) T ' (C) 


P = P + P 

(AuB) r (A) T r (B) 


donde U significa union. 


En el tema sobre probabilidad condicional existen agunos autores que utilizan simbologia diferen- 
tes a las presentadas en esta publicacion. 
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E jemplo 1. La probabilidad de obtener un As o un Rey, sacando una sola carta en una baraja espanola 
de 40 cartas. Si uno de los casos aparece, queda excluido el otro. 

o 

p -A-J_ P -A-J_ 

A 40 10 AS n 40 10 REY 

p -p , p - J_ i J_ _ _2_ _ i c 

F AoB ~ + - io + io - io -l !> 

E jemplo 2. La probabilidad de obtener un 2 o un 5, en el lanzamiento de un dado. 


^ (A) 1/6 ( a p ar j c j5 n (j e i 2) 


^ (A ) 1/6 ( a p ar j c j 5 n <j e i 5) 


p — ——i—^-z= — = 1 3 
r (AoB)~ 6 6 6 


Ejemplo 3. Tenemos una caja o recipiente con 16 bolas de 4 colores diferentes: 

3 bolas azules 6 bolas negras 2 bolas blancas 5 bolas verdes. 
^Que probabilidad tenemos de ganar o perder si las premiadas son las blancas y azules? 


o 

Posibilidades: 3 + 2 + 6 + 5 = 16 


6 S 

Probabilidad adversa: g = — + — = 11 16 

16 16 

Probabilidad: ^~16 + L5 ~^ ^ 

5 11 t 

Probabilidad total: + + 

16 16 

Se ha dicho que un espddo muestrdl es el conjunto de resultados posibles de un experimento o 
ensayo. Un ensdyo es considerado como un experimento cuyos resultados no necesariamente tienen que 
ser los mismos cada vez que se repita. 

Cualquier subconjunto del espacio muestral es considerado como evento; un subconjunto que con- 
tiene un solo punto muestral se denomina un evento elemental o punto muestral. De ahi que los resul¬ 
tados individuales que constituyen el espacio muestral reciban la denominacion de sucesos o puntos 
muestrales. 


E jemplo 4. En una empresa el personal se distribuye asi: 



Personal 

N 

A 

Vigilancia y aseo 

30 

B 

Auxiliar 

58 

C 

Operarios 

180 

D 

Supervisores y tecnicos 

70 

E 

Profesionales 

40 


Se desea saber C ual es la probabilidad 

a) A1 elegir una persona, corresponda al personal auxiliar? 

b) Al elegir una persona sea alguien de vigilancia y aseo 
o profesional? 

c) Que sea un profesional o un operario o un auxiliar. 
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o 

a) El numero total de empleados es de 378, por lo tanto la probabilidad de que sea personal auxiliar, 
sera de: 

CO 

P|W = 0J534 = 15 ' 34 *^ = 0.1534 


b) 


p +P =-1-=-= 0,1852 T7\ —0,1852 Probabilidad que sea de vigilancia y 

< A > < E > 378 378 378 (.AoH) ' aseo o profesional. 


P = P 

' (EoCoB) (E) 


+ P + P 

(C) 


(B) 


_40_ 180 _58_ 

378 378 378 


278 

378 


= 0,7354 


Probabilidad que sea profesional u 
operario o auxiliar. 


Diagramas 

El investigador ingles J. Venn (1834 — 1888) elaboro diagramas que permitieran en forma grafica 
visualizar mejor el resultado de un experimento. El espacio muestral, estara delimitado por un 
espacio en forma de cuadrado, rectangulo, circular o figura, que no corresponda a ninguna de las 
anteriores, que represente todos los posibles resultados. 

En el Ejemplo 4 el diagrama de Venn, cuando los sucesos o eventos son mutuamente excluyentes 
sera: 


o tambien 




Ejemplo 5. a) En el lanzamiento de un dado, trace un diagrama de Venn. 

b) ^Cual es la probabilidad de que aparezca un 3? 

c) ^Que aparezca 3 o un 6? 



b) Probabilidad de que aparezca un 3 = 1/6 = 0,167 

c) o E 6 ) = P (E } ) + P (F. 6 ) = 6 + 6 = '6 = 3 = 0,3333 
Probabilidad que aparezca el 3 o el 6. 


La representacion para el punto (C) sera: 



Recordemos que la probabilidad representada por el espacio muestral es 100% y la probabilidad de 
cualquier evento A, corresponded a un valor que puede variar entre 0 y 1. 


0< P 


(A) 


< 1 
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Ademas la probabilidad de que un evento no ocurra, es igual a uno menos la probabilidad de que 
si ocurra. 


P(A') = 1 - P(A) 


PA =1-| = |- | = | = 0, 33= 3,33 
6 6 6 6 


En el diagrams de Venn se observara asi: 



Ejemplo 5. Volvamos al experimento de extraer una carta (oigase bien, una sola carta, de una sola 
baraja): ^Cual es la probabilidad de obtener un as o un seis de copas o un rey? 


o 

Probabilidad de que sea un 
Probabilidad de que sea un 
Probabilidad de que sea un 


as: 

Pa 

~ 40 

seis de copas: 

Pb 

1 

40 

rey: 

Pc 

. 4 
40 


Como solo debe ocurrir uno de estos eventos, dado que se extraera una carta, la probabilidad de que 
solo uno de ellos ocurra estara dada por: 


Sucesos compatibles 


P(A o B o C) = P(A)+ P(B)+ P(C) = 


P =A+A+A=^= 0,225 = 22,5 
r (A o b o o 40 40 40 40 


Ejemplo 6. Ahora, el experimento con la baraja de 40 cartas consiste en extraer una carta, y se desea 
saber cual es la probabilidad de que la carta extraida sea as o copas. 


Observamos que al extraer una carta puede ser as, pero tambien puede ser as de copas, cumplien- 
dose la realizacion de las dos pruebas en forma simultanea; por tal razon, se dice que los sucesos son 
compatibles , o tambien nos podemos referir a una probabilidad COnjunta. 


Se recomienda en el tema de probabilidad condicional ver o consultar otras simbologias que se han 
utilizado en otros libros. 


Se dice que dos sucesos son compatibles, o que no son mutuamente excluyentes, 
cuando la posibilidad de que ocurra un suceso no impide la ocurrencia del otro. 
En este caso la probabilidad de uno de los dos sucesos se halla asi: 


P(A 0 B) P (A) + P (B) P(AyB) 


4 10 1 13 

P (A 0 B) — - + - — - = -=0,325 = 32,5% Probabilidad que sea as o copas. 

40 40 40 40 


La probabilidad de que aparezca un as: P , = 


14 


(A) 40 

10 

(B) _ ~40 


199 


La probabilidad de que aparezca copas P 
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La probabilidad de que sea el as de copas: P (AyB = - 

40 

En un diagrama de Venn se pueden representar eventOS compatibles. 



Los eventos A y B no son mutuamente excluyentes, ya que tienen 
algunos elementos en comun. 


Es corriente utilizar simbolos, tales como A Q 8 para indicar la union de A con 8, y A D 8 la 
interseccion de A con 8. 


La anterior expresion de: 

Se podra reemplazar por P (AuB) = P (A) + P (B) - P (AnB) 

Ejemplo 7. A1 lanzar un dado, usted apuesta $1,000 a que el numero obtenido debe ser par o divisible 
por 3. ^Cual es la probabilidad de que usted gane en este lanzamiento? 


P = P + 

(A oB) r (A) T 


P - P 

(B) ' (A yB ) 


Que aparezca un numero par {2, 4, 6} 


P(A > 6 


Ahora, que sea divisible por 3 sera {3, 6} P (A) = —. Pero observamos que el 6 aparece tanto en 

1 


el suceso A como en el B por tanto, se tendra que {6} P 


(AOB) g 


_ 3 2 14 2 

'/■aii n = -+-—-—-— 0,6667 = 66,67% La probabilidad de ganar. 

(4Ufi) 6 6 6 6 3 


Ejemplo 8. La probabilidad de que un alumno del instituto tenga un libro de matematicas en su biblioteca 
es 0,7; un libro de estadistica es 0,4 y de que tenga ambos es 0,30. ^Cual es la probabilidad de que un 
estudiante del instituto tenga un libro de matematicas o un libro de estadistica o ambos libros? 

P ( A U 8 ) — 0,7 + 0,4 — 0,3 — 0,8 Probabilidad de obtener un libro de matematica o de estadifstica. 


Colectivos ex austivos 


Se dice tambien, que los eventos son colectivamente exhaust'lVOS si no es posible 
obtener otro resultado para un experimento dado, es decir, por lo menos uno de 
ellos debe ocurrir. Asi por ejemplo, al extraer una carta de una baraja de 52, ^cual 
es la probabilidad de que sea trebol o diamantes o corazones o espadas? Se puede 
observar que se agotan todas las posibilidades, ya que se considera la totalidad de 
los elementos; la probabilidad sera igual a 52/ 52 = 1,0. 
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REGLADE LA M ULTIPLICACION 

Sucesos independientes 

Se dice que dos o mas sucesos son independientes, si la probabilidad de presentacion de ninguno de ellos 
queda influenciada por la presentacion del otro. En caso contrario se dice que son dependientes. 

En otras palabras, si el resultado de un suceso no afecta al otro, se dice que son independientes, por 
lo tanto se efectuara la multiplicacion de las probabilidades para cada suceso. 


Si Pj, p 2 , p 3 , . p n , son las distintas probabilidades de presentacion de n sucesos 

independientes, la probabilidad (P) de que ocurran todos estos sucesos en un 
solo ensayo, estara dada por el producto de las probabilidades para cada suceso. 

P= Pl xp 2 xp r ...xp n 

E jemplo 8. <',Que probabilidad tendremos de obtener dos Reyes sacando una carta de una baraja y la otra 
de una segunda baraja? 


o 


4 4 

40" X_ 40 


16 

1.600 


= 1/100 


p 

= P P 

1 (A o B) 

(A) r (B) 


E jemplo 10. Al lanzar dos dados, ( ',ciuil es la probabilidad de sacar dos cincos? 


o 

n 1 1 

r = — (5 en el primer dado); p = — (5 en el segundo dado); 
1 6 2 6 


p = 



i 

36 


Recordemos cuando se dice que dos o mas eventos son independientes entre si, la 
ocurrencia de un evento no esta relacionada con la ocurrencia de los otros. Si hay 
tres eventos independientes A, B y C, la probabilidad de que ocurran A, B y C se 
obtiene al multiplicar las tres probabilidades. 

P(A y B y C) = P(A). P(B). P(C) 


E jemplo 11. Supongamos que se dispone de tres barajas de 40 cartas cada una. Se desea extraer tres cartas, 
una de cada baraja; ^cual es la probabilidad de obtener un as y un rey de oros y un seis de copas? 


o 

En la primera baraja se tienen 4 ases, siendo: 
En la segunda baraja se tiene un rey de oros: 
Y en la tercera baraja hay un seis de copas: 


P(A) = 4/40 
P(B) = 1/40 
P(C) = 1/40 


Observamos que los resultados son independientes, pues ninguno de ellos se ve afectado por la 
aparicion del otro; en estos casos aplicamos la regia especial de multiplicacion, siendo: 


P(A yB yC ) 


4 i i 4 

4CT X 40 " X lo” ~ 64.000 


-= 0,0000625 

16.000 
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Es necesario clarificar un poco mas la diferencia entre sucesos mutuamente excluyentes 

y sucesos independientes. 

a) En el primero se tiene un solo dado, una baraja; en el segundo son dos o mas dados 
o barajas. 

b) En el primero se extrae una sola carta, o se obtiene una sola cara, es decir, se espera 
la presentacion de un suceso; en el segundo se espera la presentacion de dos o mas 
sucesos. 

c) En el primero utilizamos la conjuncion “o” y en el segundo la conjuncion “y”. 


Ejemplo 12. Una fabrica de calzado produce, independientemente costura (toda la parte superior del 
calzado relacionada con el cuero), suela y tacon, siendo estas partes armadas aleatoriamente en cada 
zapato. Se sabe que en este proceso, el cinco por ciento de las costuras, el cuatro por ciento de las suelas 
y el uno por ciento de los tacones tiene fallas; <^que porcentaje de pares de zapatos resulta: a) con fallas 
en sus tres componentes?; b) sin fallas en su tres componentes? 


o 

a) P(CyCyS) = (0,05) (0,04) (0,01) = 0,00002 = 0,002% 

b) P (C) = 1 - 0,05 = 0,95 P (s) = 1 - 0,04 = 0,96 P (t) =1-0,01= 0,99 

P(C y C y S ) = (0,95) (0,96) (0,99) = 0,903 = 90,3% 


Ejemplo 13. Una maquina en buenas condiciones de trabajo, produce un articulo defectuoso por cada 
mil. Los resultados correspondientes a articulos producidos sucesivamente son independientes. ^Cual es 
la probabilidad para que los proximos dos articulos producidos por esta maquina no tengan fallas? 


La probabilidad de que el articulo no sea defectuoso es igual a: 


P =1 


1 


1.000 


1 


999 


1.000 1.000 1.000 1.000 


= 0,999 


Ahora la probabilidad para A y B sera: P(A y B) = (0,999) (0,9998001) = 99,8% 


Sucesos dependientes 


Se dice que los sucesos son dependientes o eventOS COmpuestOS, si la ocurrencia 
o no ocurrencia de un evento en cualquier prueba afecta la probabilidad de otros 
eventos en otras pruebas, es decir que la probabilidad del segundo suceso de- 
pende del primer suceso, el del tercero de lo que haya sucedido en el primero y 
segundo y asi sucesivamente. 


Si se van a extraer tres cartas de una baraja, se debe hacer sin reposicion, es decir, al extraer una 
carta, ella no vuelve a formar parte del total y en vez de tener 40 cartas, para la segunda se tendran 39. 
Recordemos, que dos o mas eventos son dependientes, cuando la ocurrencia de uno afecta la ocurrencia 
de los otros, en un orden determinado. En caso contrario los sucesos son independientes. La formula 
general sera: 


P = p v n„ x n„ v . 

. v 0 

r\ X r2 A ^3 X 

X r n 
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E jemplo 14. Probabilidad de obtener 3 ases, sacando sucesivamente tres cartas de una baraja espanola, 
sin volverlas a incluir (sin reposicion) en el monton. 


o 




P - —x —X — 

^“40 X 3 X 3 


1 

2 470 


E jemplo 15. Probabilidad de obtener un As, un Rey y una Zota, sacando sucesivamente tres cartas, sin 
reposicion, de una baraja de 40 cartas. 

o 

4 „_4 4 D _ 4 4 4 _ 64 

P\ 40 (As) Pi 3 ( » Pi 38 (Zan) 40 ’ 3 ’ 38 5 .280 

Ejemplo 16. De una baraja de 40 cartas se desea extraer tres cartas en forma sucesiva sin reposicion, 
es decir, la carta que se extrae no regresa a la baraja; ^cual es la probabilidad de que en la primera 
extraccion aparezca un as y en la segunda un rey de 0T0S y en la tercera un seis de copes ? 


A1 extraer la primera carta as, se tiene que P (A) = 4/40; luego al extraer la segunda rey de oros, se 
hara sobre un total de 39 cartas, por tanto P B = 1/39; luego, la tercera carta seis de copas, se ten- 
dra que P (C) = 1/38. La probabilidad de que todos estos sucesos dependientes ocurran sera igual a: 


P(A y B yC )= P (A) x P (B) x P (C) 


4 1 x 1 _ 4 

40 39 38 59.280 


1 

14.820 


= 0,00006747 


Generalmente se expresa lo anterior, de la siguiente manera, con el mismo resultado: 


P(AyB yC ) = P(A)-P(B\A)-P(C\AyB ) 
P(AyByC ) = 40 x 39 x 33 = 59 _ 2 80 


Ejemplo 17. Supongamos que se tiene una caja con 10 monedas de $100, y dos de ellas son falsas. Se 
van a extraer dos monedas, una despues de la otra sin reposicion; ^cual es la probabilidad de seleccionar 
una moneda falsa seguida por otra tambien falsa? 


o 

P (A y B) = P (A) • P (B \ A) Tambien se puede expresar asi. P(v4n5) = P(4)-P(6|yA) 

PMySj = ^xI=^ = i = °,°2 2 2 = 2.22% 

P (A fl B ) se denomina probabilidad conjunta de A y B; P(A) se denomina 
probabilidad marginal de A; P(B/A) es la probabilidad condicional de B respecto 
a A. 


Ejemplo 18. Se extraen tres cartas sin reposicion de una baraja de 40 cartas; ^cual es la probabilidad de 
que las tres sean zotas? 

P(4 i n^ 2 n^ 3 )= P(4 1 )-P(A 2 /4 1 ).P(4 3 /4 1 y4 2 ) 

PAAA, xf = J fo = ? i B =0,OOW04=0,04 
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EJERC 1C IQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

Sucesos mutuamente excluyentes y sucesos compatibles 

87. Se extrae una carta al azar de una baraja de 40 cartas. ^Cual es la probabilidad de que sea As o 
figura? 

88. Se encuentran reunidas 4 personas con diferentes profesiones: Abogado, Economista, Ingeniero, 
Administrador. Se elige una persona al azar. ^Cual es la probabilidad de que sea Abogado o 
Economista o Administrador? 

89. Considere una baraja de 52 cartas y se desea extraer una carta. ^Cual es la probabilidad de obtener 
una que sea J o corazon? 

90. Si en el ejercicio anterior se dijera, al extraer una carta, ^cual es la probabilidad de obtener una que 
sea diamante o trebol? 

91. En un grupo de estudiantes la probabilidad de que tengan computador es de 0,60: auto de 0,30 y que 
tengan ambos, 0,25. ^Cual es la probabilidad de que un estudiante tenga computador o auto o ambas 
cosas? 

92. Suponga que se tienen 30 fichas de tres colores asi: amarillo, 15 fichas; negro, 10 fichas y azul, 5 
fichas. Al mezclarlas, ^Cual es la probabilidad, al sacar una de ellas, de que sea: a) azul; b) azul o 
negra; c) amarilla o negra? 

93. En una baraja de 40 cartas, al extraer una carta, ^Cual es la probabilidad de obtener una carta que 
sea figura o copas? 

94. En un grupo de estudiantes la probabilidad de obtener un puntaje bajo es 0,20; que se haya graduado 
en la universidad es 0,5 y que se den ambos es 0,05. ^Cual es la probabilidad que un estudiante 
obtenga un puntaje bajo o se haya graduado en la universidad? 

95. Si de un naipe bien barajado, de 40 cartas, se extrae una carta, ^Cual es la probabilidad de 
obtener: 

a) Un caballo o un rey b) Una zota de copas o un rey c) Una figura o copas 
d) Oros o un 6 e) Seis de espadas o figura f) Un as o figura 

96. Se tiene una urna con 20 bolas de plastico distribuidas en los siguientes colores: 5 amarillas, 8 
negras y 7 rojas. Extraiga una bola, teniendo el cuidado de revolverlas antes de extraerlas. ^Cual es 
la probabilidad de que la bola seleccionada? 

a) Sea negra b) No sea amarilla c) Sea roja d) Sea amarilla o negra 

97. Suponga que: P(A) = 0,20 P(B) = 0,70 y P(AyB) = 0,10 

a) /,AyB son mutuamente excluyentes? 

b) Obtenga la probabilidad para P(A o B) 

c) ^Son Ay B colectivamente exhaustivos? 

98. Supongamos una baraja de 52 cartas de la que debemos extraer una carta. Nos dan un premio si la 

carta extraida es trebol o K. /,Cual es la probabilidad de ganar? 
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99. a) Consideremos el lanzamiento de un dado. Usted gana, si el resultado es impar o divisible por 

dos. ^Cual es la probabilidad de ganar? 

b) Si planteamos el ejercicio de ganar obteniendo un resultado par o divisible por 3, ^cual seria la 
probabilidad de ganar? 

100. La mama lleva a su hijo a una tienda y le ofrece una de tres galguerias. La probabilidad de que 
escoja un helado es del 70%; kumis, 0,40 y helado y kumis, 0,30. ^Cual es la probabilidad de que 
compre helado o kumis? 

101. En un dia programado para realizar un paseo por el parque, la probabilidad de que haga sol es de 
0,60; de que llueva, 0,20 y de que haga sol y llueva, es de 0,03. /,Cual es la probabilidad de que 
llueva o haga sol? 

102. Si el Banco de la Republica exige que se rebaje la tasa de interes al 32%, existira una probabilidad 
del 80% de que la inflacion para ese ano sea superior al 25%. ^Que interpretacion le daria usted al 
80%? 

103. Se compraron 30 lapices de diferentes colores: 12 azules, 8 amarillos y 10 verdes. ^Cual es la 
probabilidad al extraer un lapiz de que sea: a) azul; b) azul o amarillo; c) amarillo o verde? 

104. A un cargo se presentan 16 candidates de diferentes profesiones; 6 economistas, 4 administradores 
2 contadores y 4 ingenieros industriales. ^Cual es la probabilidad de que el cargo sea ocupado por 
un economista o un administrador? 

Sucesos independientes 

105. Que probabilidad tendremos de obtener 2 reyes, sacando una carta de una baraja y la otra de una 
segunda baraja? (Ambas barajas son espanolas). 

106. En un solo lanzamiento de dos dados, ^que probabilidad tenemos de sacar dos cincos? 

107. Juan y Grisel estudian en un mismo curso. La probabilidad de que Juan no pierda ninguna materia 
es de 0,8 y que Grisel obtenga el mismo resultado es de 0,90. /,Cual es la probabilidad (a) de que 
los dos no pierdan ninguna materia; (b) que Juan pierda por lo menos una y Grisel ninguna; (c) que 
ambos pierdan? 

108. De una baraja de 40 cartas se van a extraer 3 cartas con reposicion. ^Cual es la probabilidad de que 
la primera carta sea Rey y la segunda As y la tercera 6 de copas? 

109. Supongamos que un taller dispone de dos maquinas. En la primera se produce el 1,5% de unidades 
defectuosas y en la segunda el 3%. ^Cual es la probabilidad de que al extraer una de cada maquina, 
las dos sean defectuosas? 

110. ^Cual es la probabilidad, al seleccionar 5 personas en un grupo, de que las 5 sean mujeres? 

111. Se lanzan 3 monedas, ^cual es la probabilidad de que las tres sean caras? 

112. Cuatro amigos que se dirigen a un lugar, toman 4 rutas diferentes de acuerdo al riesgo que se corre 
de tener algun accidente. Si se le asignan las probabilidades de riesgo para cada ruta: 0,2 0,15 0,25 
0,10. Encuentre la probabilidad: 

a) De que ninguno sufra dificultades 

b) Que los cuatro sufran accidentes 

c ) Los dos primeros sufran accidentes y los restantes no 
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113. A1 sacar dos cartas con reposicion de una baraja de 52 cartas, cual es la probabilidad de que: 

a) Ambas sean diamantes; b) Ambas sean figuras (J, K); c) Ambas sean corazon y diamante 

114. ^Cuales serian sus respuestas al ejercicio anterior, si las dos cartas se extraen sin reposicion? 

115. Un hombre posee un negocio y es, ademas, propietario de su casa. En un ano cualquiera la 
probabilidad de que la casa sea robada es 0,08, y la probabilidad de que su negocio sea robado es 
0,14. Suponiendo que estos eventos sean independientes, cual es la probabilidad de que: 

a) Sufra robos en ambos lugares en este ano 

b) No se presenten robos en ninguno de los dos 

116. En forma independiente se lanza una moneda y se extrae una carta de una baraja de 52 cartas y se 
lanza un dado. ^Cual es la probabilidad de observar cara en la moneda, as en la carta y el tres en el 
dado? 

117. De una baraja de 40 cartas se van a extraer 3 cartas con reposicion. ^Cual es la probabilidad de que 
la primera carta sea un Rey, la segunda un As y la tercera un 6 de Copas? 

118. Una fabrica tiene cuatro maquinas de diferentes modelos, la primera del ano 2005 y una probabilidad 
del 12% de danarse en un dia de trabajo, otra de 2007, con el 7%; la tercera de 2009, con el 2% y la 
ultima de 2011 con el 1%, en un dia de produccion. Calcule la probabilidad de que: 

a) Ninguna se descomponga o dane b) Todas se descompongan. 

119. Una maquina que produce un determinado articulo fue adquirida bajo la condicion de que el 3% de 
los articulos producidos son defectuosos. Si el proceso se realiza bajo control, es decir independiente, 
^Cual es la probabilidad de que: 

a) dos articulos seguidos sean defectuosos? 

b) dos articulos seguidos no sean defectuosos? 

c) un articulo defectuoso y el otro bueno, en cualquier orden? 

d) tres articulos seguidos sean buenos? 

120. Tengo en el bolsillo del saco dos bolas de plastico una roja y otra verde. ^Cual es la probabilidad de 
sacar 3 veces sucesivas (con reposicion) la bola roja? 

121. En un recipiente se tienen 10 bolas azules y 5 rojas y en un segundo recipiente se tienen 8 bolas 
blancas y 12 rojas. /,Cual es la probabilidad de sacar bolas rojas, si extraemos una de cada recipiente? 

122. Suponga que pintamos dos caras de un dado de rojo, tres de verde y una de azul. ^Cual es la 
probabilidad, al lanzar cuatro veces el dado, de obtener: 

a) las tres primeras veces verde y la ultima rojo? 

b) solo las tres primeras rojo? 

c) que en los tres primeros lanzamientos se obtenga azul? 

Sucesos dependientes 

123. Una persona saca de una baraja de 52 cartas sin reposicion; simultaneamente otra persona lanza una 
moneda. ^Cual es la probabilidad de que la primera persona saque en compania de la segunda tres 
cartas de la misma pinta y una cara? 

124. Cuatro personas sacan sucesivamente una carta de un mazo de 40 sin reposicion. ^Cual es la 
probabilidad de que la primera persona saque el As de espadas, la segunda el Rey de copas, la 
tercera un Rey y la cuarta un As? 
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125. En una bolsa hay seis bolitas blancas y cinco amarillas. Se sacan de una en una sin reposicion. 
/,Cual es la probabilidad de que la primera sea blanca, la segunda amarilla, la tercera blanca y asi 
sucesivamente? 

126. Se extraen 3 cartas sin reposicion de una baraja de 52 cartas. ^Cual es la probabilidad de que: 

a) en la primera carta aparezca una K y en las siguiente no aparezca? 

b) en la tercera carta aparezca la primera K? 

127. /,Cual es la probabilidad de obtener 3 ases, sacando sucesivamente 3 cartas de una baraja de 40 
cartas, sin volverlas a incluir en el mazo (monton)? 

128. Suponga que se tiene una uma con veinte bolas, de las cuales, cinco son amarillas, ocho negras y 
siete rojas. 

a) Extraiga tres bolas sin reposicion, ^cual es la probabilidad de que la primera sea amarilla, la 
segunda negra y la tercera roja? 

b) Si se hubiese pedido con reposicion, ^cual seria la probabilidad anterior? 

129. Se extraen tres cartas sin reposicion de una baraja de 40 cartas. 

a) /,Cual es la probabilidad de que las tres sean ases 

b) iX>q que las tres sean oros? 

130. Se extraen cinco cartas sin reposicion de una baraja de 40 cartas, ^Cual es la probabilidad de que las 
cinco sean copas? 

131. Dos equipos de balompie revuelven sus camisetas, 11 son de color verde y las restantes 11 azules. 
Se van a extraer 2 camisetas. /,Cual es la probabilidad de que las dos sean rojas? 

132. Despues de inspeccionar un lote de 10 unidades, se encontro que 2 son defectuosas y las restantes 


buenas. Si de los 10 extraemos dos unidades, ^cual es la probabilidad de que las dos sean defectuosas? 

PROBABILIDAD CONDICIONAL 


Los simbolos que se presentan a continuacion son algunos de los mas comunes en textos de estadistica. 


P 


=> Probabilidad de que ocurra el suceso A 


P 


= P (A) => Probabilidad de que no OCL/rra el suceso A. 


Tambien simboliza la probabilidad del complemento A 


P 


(A B ) 


=> Probabilidad de que ocurra A dado que ha. ocurrido B. 

Tambien simboliza la probabilidad condicional de A dado B. 


P 


(A (IB ) 


=> Probabilidad de que ocurra t anto A C0U10 B en un experimento. 
Tambien simboliza la probabilidad de la interseccion de A y B o 
la probabilidad COnjunta de A y B. 


P 


(AUB) 


=> Es la probabilidad de que ocurra A, 0 bien B, 0 ambos , en un experimento. 
Tambien simboliza la probabilidad de la union de A y B. 


En nuestro tema, de la probabilidad condicional de A, dado B, se tendra que: P (A b~ — 
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En el caso contrario, es decir, la probabilidad condicional de 
La ray a vertical significa dado que. 



■ Recordemos que en la probabilidad de sucesos mutuamente excluyentes 
simbolizamos asi: P {A o B) = P (A > + P ( B) De acuerdo a las anotaciones se podra decir 
tambien que P (A UB) = P (A) + P (B) 

■ En los SUCeS0S compatibles lo simbolizamos asi: p = p + p _p 

(A OB) r (A)^ r (B) r (AyB) 

Ahora lo podemos presentar: P (A u B) = P (A) + P (B} ■- P (An B y 

■ En los sucesos independientes, utilizamos P (AyB) = P (A) P (B) Ahora se puede 
presentar que P (AnB) = P (A) P (B A) =P (B) P (A B) 


La probabilidad condicional es aquella que se presenta en un evento o suceso, dado que otro evento 
ya ha ocurrido. 

Existe tambien la probabilidad COnjunta cuando se presentan dos o mas eventos en forma simultanea. 

Todos se presentan bajo condiciones de dependencia estadistica. No hay que olvidar que existen 
las probabilidades marginales, correspondientes a una probabilidad incondicional de que se presente un 
evento, se refiere a la probabilidad de un solo evento. 

En la regia de la multiplicacion, la probabilidad conjunta de A y B se calculaba mediante la aplica- 
cion de la formula P (A y B = P (A) P (A B) = P (AnB) de donde podemos despejar la formula para la probabilidad 
condicional de un evento. 


p 

P 

p _ (AyB) 

(AHB) 

(A B) p 

P o 

(B) 

(B) 


E jemplo 1. Se encuentra en una facultad que del 70% de los alumnos matriculados, el 70% son mujeres 
y el 18%, mujeres estudiantes de economia. Si elegimos un estudiante al azar y resulta que es mujer, 
^cual es la probabilidad de que este estudiando economia? 


o 


, p _ r (AP\B) 
(A B) p 

(B) 


0,18 

0,70 


= 0,2571 = 25,71% 


Probabilidad que este estudiando economia. 


E jemplo 2. Por una investigacion reciente se encontro que el 10% de los conductores de taxi en la ciudad 
son hombres con estudios universitarios. Tambien se sabe que el 80% de los conductores de taxi son 
hombres. ^Cual es la probabilidad, al tomar un conductor de taxi al azar, que resulte ser hombre, y que 
tenga ademas estudios universitarios? 


(A B) ’ 


(AHB) 


(B) 


0,10 

080 


o 


— 0,125 = 12,5% Probabilidad que conduzca taxi y tenga estudios superiores. 
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Ejemplo 3. El 18% de las familias de un barrio tienen vehiculo propio, el 20% tiene vivienda de 
su propiedad y el 12%, vivienda y vehiculo. ^Cual es la probabilidad de tener vivienda si se tiene 
vehiculo? 


A = Propietario de vehiculo 
A’ = No propietario de vehiculo 
B = Propietario de vivienda 
B’ = No propietario de vivienda 




B 

B' 

TOTAL 


A 

0,12 

0,06 

0,18 


A' 

0,08 

0,74 

0,82 

TOTAL 

0,20 

0,80 

1,00 


(B A) 


0,12 

0,18 


= 0,66 


(B A) 


(A (IB) 


(B) 


TEOREMADE BAYES 


El matematico y reverendo Thomas Bayes, (1763) en el siglo XVIII intento desarrollar una formula para 
evaluar la probabilidad de la existencia de Dios con base en evidencias terrenales. Mas tarde fue Laplace 
quien termino su desarrollo denominandolo “Teorema de Bayes”. 

El teorema de Bayes es un metodo aplicado generalmente para calcular probabilidades posteriores. 

Este teorema se aplica cuando se formulan hipotesis a posteriori sobre la probabilidad a priori de 
eventos ya ocurridos. 

La formula general aplicable es: 


(A; B ) = - 

P P +P P + +P P 

Este teorema establece, que si sucede cierto evento, que depende de la ocurrencia de los eventos A 
o B o C correspondientes a un conjunto de sucesos mutuamente excluyentes, la probabilidad de que B 
haya ocurrido a consecuencia de A, lo cual lo expresamos: P (A B corresponda al producto de las proba¬ 
bilidades individuates del evento A y del evento B, dividido por la probabilidad altemativa del evento B 
con respecto a cada uno de los eventos independientes de A, B y C. 

La formula siguiente esta dada en el caso que utilicemos las letras A, B y C. 


P 

P P 

(A) r (EA/) 

(A, E )~ 

P P +P P +P P 

F {A) F (E 1 A) r ( B ) r (E 2 B r r (C) r (E 3 C ) 


Ejemplo 1. Volvamos a nuestro ejemplo de las 4 maquinas A, B, C y D. Por especificaciones y control 
conocemos la capacidad de produccion de cada maquina, durante un determinado periodo (1 hora) asf: 
A. una produccion de 600; B, de 400; C, de 300, y D, de 700 unidades, es decir, en terminos porcentuales 
A produce el 30%, B el 20%, C el 15%, y D el 35%. Mediante un proceso de observacion se ha detecta- 
do que el porcentaje de unidades defectuosas producidas por cada una de las maquinas es del 4%, 3%, 
6% y 5%, respectivamente. Si procedemos a sacar un elemento del total del lote examinado. ^Cual es 
la probabilidad de que haya sido producida por la maquina A, o por la maquina B, o por la maquina C o 
por la maquina D? 
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Aplicaremos la formula general, dada inicialmente y no la segunda expresion. Sabemos que la 


P (A t ) ®’^0 % 2) ^,20 


P(a 3 ) ^45 % 4 ) ®,35 


son las probabilidades independientes de A { A 2 A 3 y A 4 respectivamente. 


Siendo: P (B4) = 0,04 


Podemos calcular: 


P (B A,) ^,03 


P (B A~) ^,06 


P(BA 4 ) 


P ( a/ ( b A i) =0,30 (0,04) = 0,012 
P ( a/ ( ba, =0,15 (0,06) = 0,009 


P ( a/ ( ba 2) = 0,20 (0,03) = 0,006 
Pca/cbaa =0,35 (0,05) = 0,0175 


La suma de las probabilidades sera = 0,012 + 0,006 + 0,009 + 0,0175 = 0,0445 

Para calcular la probabilidad de que la unidad defectuosa haya sido producida por cada una de las 
4 maquinas, utilizamos la formula de Bayes, asf: 

p = _ 0,30 (0,04) _ 

{A ' I n) 0,30 (0,04) + 0,2 (0,03) + 0,15 (0,06) + 0,35 (0,05) 


r UI«) 


r (A 2 \B) 




\ a a I K ) 


0,3 ( 0,04) 
0,0445 

0,20 ( 0,03) 
0,0445 

0,15 (0,06) 
0,0445 

0,35 (0,05) 


= 0,2 67 = 2 ,67 
= 0,1348 = 13,48 
= 0,2022 = 20,22 
= 0,3 33 = 3 ,33 


0,0445 

Podemos utilizar el diagrdma de arbol en dos etapas 





P = 0,30 (0,04) = 0,012 


P = 0,20 (0,03) = 0,06 


P = 0,15 (0,06) = 0,009 


P = 0,35 (0,05) = 0,0175 
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Ejemplo 2. Se tienen 3 recipientes; el primero contiene 6 bolas azules y 2 rojas; el segundo 4 azules y 
4 rojas y el tercero 6 azules. Se selecciona una de las tres umas al azar y de ella se extrae una bola que 
resulta ser azul. Con la anterior informacion. ^Cual es la probabilidad de que el recipiente escogido sea 
el primero?, Sea el tercero? 


^(4) 

i 

3 

P I 

u 2 ) 3 


P I 

(4) 3 

P (B\ 4) 

6 3 

8 4 

p 4 

r (B\A 2 ) g 

1 

2 

P 1 1 

r (B\A 3 ) g 1 

La probabilidad de que la bola azul provenga del primer recipiente sera: 

p 


P (A) P b\a 



r A\B 

”(4) ”fl|4 

P (A 2 ) P b\a 2 

"(4) "«|4 


p 


(l/3)(3/4) 


1 °' 33 

r A\B 

(1/3) (3/4) 

(1/3) (1/2) 

(1/3)0) 

La probabilidad de que provenga del tercer recipiente 

P 


(1/3) (1) 


1 0,44 

r a 3 \ b 

(1/3) (3/4) 

(1/3) (1/2) 

(1/3) (1) 


Ejemplo 3. Un autor, por intermedio de la editorial envia folletos promocionando su libro de estadistica 
al 72% de los profesores que ensenan la asignatura en las universidades que fueron seleccionadas para 
la promocion. Un mes despues se constato que el 46% que recibieron el folleto adoptaron el libro y un 
16% que no lo recibieron, tambien lo adoptaron. /,Cual es la probabilidad de que un profesor que adopta 
el libro, fue el resultado del folleto de promocion? 



AAB 


0,72 (0,46) 

0,72(0,46) (0,28) (0,16) 


0,8809 


EJERCICIQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

133. Un analista financiero descubrio que el 40% de las acciones experimentaron un comportamiento 
superior al promedio, el 18% inferior y el 42% se mantuvieron alrededor del promedio. El 40% del 
primer grupo fue considerado como buenas adquisiciones, lo mismo que 30% del segundo grupo y 
un 10% del ultimo grupo. ^Cual es la probabilidad de que un valor correspondiente al primer grupo 
crezca por encima del promedio? 
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134. La probabilidad de que se presenten 3 eventos A, B, C son P = 0,15; P = 0,50; P rr = 0,35. 

vv v^/ vUj 

Supongamos que se han presentado A, B o C, la probabilidad que se presente otro evento D, es: 
P (D/Ar 0 ’ 72 ’ P (D/ B r 0 ’ 4 y P (D/cr 0 ’ 60 ' Encuentre la probabilidad de P (B/D) . 

135. Una empresa utiliza tres metodos para recuperar la cartera morosa. El 50% es requerido 
telefonicamente, el 30% es visitado por el cobrador y el 10% por correo. Las probabilidades de 
que haya cancelacion de la deuda o por lo menos abono a la misma, de acuerdo a los tres sistemas 
anteriores son: 0,62; 0,80 y 0,54 respectivamente ^Cual es la probabilidad de que la peticion de 
pago haya sido efectiva, mediante el correo? 

136. Con la siguiente informacion P (A1) = 0,6; P (A2) = 0,25; P (A3) = 0,15 y las probabilidades conjuntas de 
P (Ai y b) son: 0,09; 0,12 y 0,18 respectivamente. ^Cual sera la probabilidad de P (A2/B) ? 

137. En un curso de estadistica se sabe que el 75 % realiza el taller en forma personal. Tambien se sabe 
que el 92%, de los que hacen el taller en forma individual, gana el curso y el 40% lo pierde cuando 
el taller lo copian o no lo hacen en forma individual. /,Cual es la probabilidad que el haya hecho sus 
tareas individualmente? 

138. Use el teoremade Bayes para determinar la probabilidad de P si se tiene la siguiente informacion 
P =0,18; P (A2) = 0,46 y P = 0,36, ademas, las probabilidades condicionales son P (B/A1) = 0 , 21 ; 

P (B/A2)= 0 ’ 08 y P (B/A3) =0 ’ 14 

139. Supongamos que se tienen dos recipientes A p y A 2 , en el primero se tienen 26 bolitas, de las cuales 
10 son azules y 16 verdes; y en el segundo son 26, distribuidas asi: 6 azules y 20 verdes. Si se elige 
al azar una uma y de ella se extrae una bolita, ^cual es la probabilidad de que sea verde? 

140. De acuerdo con el punto anterior. ^Cual es la probabilidad de que sea verde proveniente del 
recipiente A? 

141. De acuerdo al ejercicio 139. ^Que sea la bolita verde proveniente del recipiente A 2 ? 


EJERCICIOSMISCELANEOS 

142. Se lanzan dos dados correctos. Calcular la probabilidad del suceso: “la suma de sus caras sea mayor 
a 8”. 

143. Se extrae al azar una carta de una baraja de 40 cartas. Sea A el suceso de que la carta elegida es un 
Rey y B el suceso de que la carta elegida sea Copas. Calcular la probabilidad de que uno de los 
sucesos ocurra. 

144. /,Cuantas combinaciones posibles pueden hacerse con 52 cartas de una baraja, tomadas de 4 en 4? 

145. En una carrera de caballos participan 10 caballos. La apuesta consiste en escoger tres caballos que 
pasen en los primeros lugares a la meta. 

a) ^Como se daria un caso de permutaciones? b) ^Como se daria un caso de combinaciones? 
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146. Se lanza un dado rojo y otro verde. 

a) ^Cual es la probabilidad de que habiendo salido el 5, en el dado Rojo, la suma sea mayor que 10? 

b) ^Cual es la probabilidad de que habiendo salido el dos, en el dado Verde, la suma sea menor que 7? 

c) ^Cual es la probabilidad de obtener 7 como suma, sabiendo que en el dado Rojo aparece un 
numero menor de 4? 

147. Se tiene una baraja de 40 cartas y se sacan cinco de ellas sin reposicion. ^Cual es la probabilidad que 

a) las 3 primeras cartas sean ases y las dos ultimas zotas? 

b) las 3 primeras ases, la cuarta 4 de oros y la quinta un rey? 

148. Se lanza tres veces una moneda correcta: 

a) ^Cual es la probabilidad de que unicamente en el tercer lanzamiento resulte cara? 

b) ^Cual es la probabilidad de que en el tercer lanzamiento resulte cara, sabiendo que en uno de los 
dos anteriores se obtuvo cara? 

149. iX>q cuantas maneras puede formarse un comite de 5 personas teniendo un total de 9 personas? 

150. /,Cuantos numeros de 5 cifras se pueden formar con los digitos: 2, 4, 6, 8 y 9 sin repetirlos? 

151. ^Cuantos numeros de tres digitos existen? 

152. ^Cuantas placas para vehiculos se pueden obtener empleando tres letras seguidas de 3 digitos? 

153. a) /,Cuantas palabras de 5 letras se pueden formar con las letras de la palabra LOBOS? 
b) ^En el caso, sin usar ninguna O? 

154. ^De cuantas maneras se pueden sacar dos manzanas de una caja que contiene 8? 

155. Diga cierto o falso en las siguientes aseveraciones: 

a) Una permutacion es un caso particular de las combinaciones. 

b) ABC = CBA = BCA es un caso de combinacion. 

c) V* =8 

d) c/ = q 

e) Una permutacion se diferencia de otra por la posicion de los elementos. 

f) Combinaciones de elementos, tornados de n en D, es igual a 1. 

156. Si la sexta valida del 5 y 6 corresponde al juego del marcador de 5 caballos, ^cuantos marcadores 
diferentes resultaran con once caballos, teniendo en cuenta el orden de llegada? 

157. La probabilidad de que Grisel estudie para un examen de estadistica es 0,30. Si estudia, la 
probabilidad de aprobar el examen es 0,75, en tanto que si no estudia, la probabilidad es de 0,40. 

a) ^Cual es la probabilidad de que Grisel apruebe su examen final? 

b) Dado que Grisel aprobo el examen ^Cual es la probabilidad de que haya estudiado? 

158. Se piensa elegir una Junta Directiva compuesta por un Presidente, un Tesorero y un Secretario. 
/,Cuantas planchas diferentes se podran postular, si la asamblea esta compuesta por 20 miembros y 
todos tienen igualdad de derecho para pertenecer a la Junta? 
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159. Un equipo capitalino juega el 60% de sus partidos de dia. El equipo gana el 40% de sus partidos 
diurnos y el 80% de los noctumos. De acuerdo a las noticias que aparecen en un diario de la capital, 
perdio ayer. ^Cual es la probabilidad de que el partido se haya desarrollado de dia? 

160. Un fabricante produce 6.000 unidades por semana. Cada unidad pasa por tres puestos de inspeccion, 
antes de ser despachada a sus distribuidores. Por lo general, en el primer puesto se rechaza el 5%; 
de las que fueron aceptadas, el 3% se rechaza en la segunda inspeccion y finalmente en la tercera 
inspeccion el 2% aproximadamente. ^Cual es la probabilidad que una unidad seleccionada al azar 
pase las tres inspecciones? 

161. Supongamos que un proyecto de ley, debe ser aprobado en primera instancia por la Camara de 
Representantes, luego por el Senado y finalmente recibe la sancion Presidencial, para convertirse 
en Ley. Un politologo asevera que las probabilidades son: 0,8; 0,6 y 0,5 respectivamente. ^Cual es 
la probabilidad que el proyecto finalmente se convierta en Ley? 

162. Se tienen tres ciudades localizadas en el Eje cafetero y se quiere seleccionar una de ellas para el 
desarrollo de un evento deportivo. Por estudios anteriores se sabe que Pereira tiene una probabilidad 
del 42%, Armenia del 34% y Manizales del 24%. El comite organizador del evento supone que al 
ser consultado a un grupo mayor de personas, las probabilidades de favorabilidad en cada region 
sera 55%; 60%; 62% respectivamente ^Que ciudad tendra la mayor probabilidad de ser escogida? 

163. En la ultima temporada de vacaciones, se selecciono una muestra de 400 turistas de los cuales 240 
visitaron Santa Marta y 100 a Cartagena ^Cual es la probabilidad de que una persona seleccionada 
haya visitado durante la temporada las dos ciudades de la Costa Atlantica? Una verificacion de la 
encuesta encuentra que 70 de ellos habian visitado las dos ciudades. 

164. En una Facultad de una Universidad se sabe que el 35% estan matriculados en el diurno y el 65% 
son del noctumo. La probabilidad de que el estudiante diurno este trabajando es del 15%, en tanto, 
para el estudiante noctumo es del 70%. Se elige al azar un estudiante de esa Facultad. 

a) ^Cual es la probabilidad de que este trabajando? 

b) Dado que el estudiante elegido este trabajando, determinar la probabilidad que sea del diurno. 

165. Tres distribuidores de gas se reparten el mercado de una ciudad, al distribuidor A le corresponde 
el 50%, al B, el 30% y al C unicamente el 20%. Las autoridades locales hacen una inspeccion en 
cada una de las distribuidoras y encuentran que en A el 5% de las valvulas de los tanques estan 
defectuosos, en B el 3% y en C es del 8%. Suponiendo que la distribucion no esta demarcada por 
zonas, se presenta un escape con las consecuencias de una explosion que produce danos. /,Cual 
es la probabilidad de que el tanque causante del dano haya sido suministrado por el distribuidor 
A, B o C? 

166. Defina brevemente los siguientes puntos: 

a) Probabilidades previas b) Probabilidades posteriori 

c) Diagrama de arbol d) Teorema de Bayes. 
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Hablamos de probabilidad cuando hay incertidumbre o no se tiene la seguridad total de que 
pueda suceder. Es un concepto basico que se interpreta como algo indefinible, expresado de 
alguna manera como el grado de creencia de que algo puede suceder. 

A menudo, sin fundamento matematico, se usa como una forma conveniente de representar 
la opinion de una persona con respecto a la posibilidad de que se obtenga un resultado deter- 
minado, lo que llamamos como probabilidad subjetiva. En otras oportunidades hablamos de 
probabilidades a priori donde no se requiere la realizacion del experimento, ya que se puede 
determinar de antemano. Se tiene la probabilidad empirica que implica la realizacion del ex¬ 
perimento para ser calculada. 

La probabilidad relativa , se refiere en los casos cuando observamos que ocurrieron sucesos 
semejantes en el pasado y queremos determinar la probabilidad de que ocurra ese suceso a 
largo plazo, es decir, el numero de veces que el evento ocurrio en el pasado, dividido, por el 
numero total de observaciones. 

Existen unas reglas que pueden ayudar a su calculo, tales como la de adicion cuando los su¬ 
cesos son mutuamente excluyentes; la multiplicacion cuando los sucesos son independientes 
o dependientes; se usan tambien las reglas de conteo , con el fin de determinar el numero de 
formas de posible ocurrencia, en especial cuando el numero de sucesos posibles es grande. 

Se dice que la probabilidad de ocurrencia de un evento es un numero comprendido entre 0 y 
1. En la mayorfa de los casos, esa cifra se obtiene al dividir el numero total de exitos o casos 
favorables por el total de casos posibles. 

El investigador matematico Thomas Bayes establecio una formula, conocida como el Teorema 
de Bayes, con el fin de determinar la probabilidad de que ocurra un evento A, dado que ha 
ocurrido un evento B. 

El estudio de la probabilidad en su aplicacion, se inicio en los juegos de azar, marcando el 
camino para trabajos mas serios; como se puede observar en los ultimos anos, por el gran 
auge que ha tornado una de sus ramas conocida como Teona de los Juegos, de gran aplicacion 
donde se requiere del planeamiento para afrontar situaciones donde no se tiene informacion o 
se dispone de alguna, por lo general, de poca confiabilidad. 








Distribuciones 

deprobabilidad 

Tener conocimiento de la propia ignorancia es 
un gran paso acia el conocimiento. 

a a 


CONTENIDO 

■ Conceptos y aplicaciones teorico- 
practicos de las distribuciones de 
probabilidad. 

■ Variable aleatoria discreta: 

Distribucion Binomial, de Poisson e 
Hipergeometrica. 

■ Variable aleatoria continua: 

Distribucion normal. 


■ Manejo de Tablas, Calculadora y 

EXCEL para la realization de calculos. 


■ Smtesis de la Unidad. 


Ejercicios para Resolver, resueltos en el 

Sistema de I nformacion en L fnea SI L. 


COM PETENCIAS 


El estudiante debera estar en capacidad de: 


□ Explicar y diferenciar las distribuciones 
de frecuencias de las distribuciones de 
probabilidad. 


□ Definir e identificar las variables 
aleatorias discretas y continuas. 

□ Identificar las condiciones que se debe 
reunir, en la aplicacion de cada una de 
las distribuciones de probabilidad. 

□ Construir, aplicar y calcular probabili- 
dades asociadas a estas distribuciones. 

□ Manejar tablas, calculadora, Excel y 
formulas en la solution de ejercicios. 
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CONCEPTOSGENERALES 


Los capitulos del dos al cuatro, fueron dedicados a explicar algunos temas referentes a la Estadistica 
D escriPti va en cuanto al proceso de recoleccion de datos, elaboracion de tablas o cuadros, la representacion 
de ellos por medio de graficas y la aplicacion de algunas medidas, tales como las de: posicidn , dispersion , 
asimetria y apuntamiento. 

Entre las medidas vistas, las mas importantes a considerar fueron la M edia aritmetica , la Varianza y 
la D esviacion estandar o tipica . La Primera de ellas tenia como fin primordial, calcular un solo valor para 
representar a ese conjunto de observaciones y la Desviacion tipica para permitir determinar la posible 
dispersion o el grado de variabilidad que ocurre entre esos datos. Recordemos, que a menor variabilidad 
se presente, mayor sera la representatividad del promedio. 

Veamos algunas definiciones de terminos que se deben entender y manejar. 

□ Distribution de probabilidad. Son todos los posibles valores que resultan de un experimento 
aleatorio, junto con la probabilidad asociada a cada valor. 

En el capitulo 3 se vio el procedimiento a seguir en la elaboracion de las D istribuciones de 
frecuencias, con base en informaciones de hechos que ya habian sucedido, recolectados a 
traves de una encuesta. En este capitulo, consideraremos la Distribucion de probabilidades la 
cual se basa en hechos que probablemente pueden suceder, es decir, estamos hablando de dos 
situaciones correspondiente a hechos que suceden: antes y despues. 


Tabla 6.1 Distribucion de frecuencias Tabla 6.2 Distribucion de probabilidad 


y, 

n i 

Yi n < 

(y,-y) 2n i 


x, 

P(X) 


(x r ,,y-p t . 

i 

3 

3 

27,5427 


0 

1/16=0,0625 

0 

0,2500 

2 

5 

10 

0,6045 


1 

4/16=0,2500 

0,25 

0,2500 

4 

10 

40 

0,0090 


2 

6/16=0,3750 

0,75 

0 

5 

8 

40 

7,5272 


3 

4/16=0,2500 

0,75 

0,2500 

7 

4 

28 

35,2836 


4 

1/16=0,0625 

0,25 

0,2500 

2 

30 

121 

90,9670 


2 

16/16=1,000 

2,00 

1,0000 




121 


s 2 = 


n 30 
l(y i -y) 2 n i 


= 4,03 
90,967 


// = EX,P x =2 


= 3,03 


n 


30 


(T 2 =X(X i ~V) 2 Px =1 
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S = -J3 ,03 = 1,74 


G - 


>/U)=i 


Recordemos que la D istribucion de frecuencias permitia el manejo de cantidades de informacion 
en forma resumida, describiendo un hecho transcurrido (pasado), en cambio la distribution de 
probabilidades es similar a una distribucion de frecuencias, con la diferencia de que presenta 
valores probables de un experimento en un evento futuro. 

□ Variable aleatoria. Corresponde a una caracterizacion cualitativa de los resultados que 
constituyen un espacio muestral. Cada cantidad o valor es el resultado de un experimento 
aleatorio y, como tal, puede tomar distintos valores. 

Las variables aleatorias se clasifican en d/scretas y continuas. 

□ Variable aleatoria discreta. Se considera asi, cuando los valores que asume se puedan contar, 
y estos pueden organizarse en una secuencia al igual que los numeros enteros positivos. Solo 
podra asumir un numero finito de valores. 

□ Variablealeatoria continua. Se da, cuando puede asumir cualquier valor dentro de un intervalo 
o en una union de intervalos. Como ejemplo se podria considerar cualquier resultado en cuanto 
de medicion al ancho, longitud de una cosa, asi como a tiempo en la realizacion de una tarea; en 
estos casos las variables admiten fracciones. 


Dentro de los modelos de probabilidad, correspondiente a variables aleatorias dis- 
cretas, con mayor aplicacion se tienen: Bernoulli, Binomial, Poisson, Exponential, 
M ultinomial e H ipergeometrico y en cuanto a la variable aleatoria continua se 
considera el modelo normal estandarizado. 


A continuacion se veran algunas de estas distribuciones: Binomial, Poisson, H ipergeometrica y 
Normal. 


VARIABLE ALEATORIA DISCRETA 


DISTRIBUCION BINOMIAL 


Algunos la denominan como metodo exacto y como ya se menciono, corresponde a una distribucion 
de variable aleatoria discreta. Pero antes de comenzar a explicar en que consiste, como se calcula y en 
que casos se debe aplicar, vale la pena recordar algunos conocimientos, que nos puedan ser utiles en la 
distribucion binomial: el Binomio deNe ton y el Triangulo de Pascal. (VerSIL., capitulo 6). 

Se puede considerar “que si durante repetidos ensayos, siendo p la probabilidad de exito en un solo 
ensayo, la cual debe permanecer fija, y q la probabilidad de fracaso, entonces la probabilidad P de que 
se obtengaXexitos en D ensayos, es el termino del desarrollo binomial de (Q+p) n “. La formula general 
para cada termino es: 
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n = Numero de ensayos 
X - Numero de exitos 
p = probabilidad de exito en cada ensayo 
q = probabilidad de fracaso en cada ensayo 

Los criterios que debe satisfacer una experiencia binomial son: 


a) Debe existir un numero fijo de pruebas repetidas (D) 

b) Cada una de las n pruebas debe tener dos resultados, favorable o desfavorable. En el caso 
de la moneda, sera: cara o sello, por lo tanto son sucesos mutuamente excluyentes. 

c) La probabilidad de exito de un acontecimiento es fij o, algo similar sucede con la probabilidad 
de fracaso. 

d) Las pruebas son independientes, ya que el resultado de un ensayo no afecta el resultado de 
otro. 

e) Nos interesa el numero de exitos en n pruebas. 


Ahora procedemos a elaborar el espacio muestral para el experimento consistente en lanzar cuatro 
monedas (n = 4), con el consiguiente resultado. 


Tabla 6.3 Espacio muestral en el lanzamiento de 4 monedas 



14 6 4 1 

16 76 76 76 76 


Consideremos como exito la aparicion de cara (C) y como fracaso la obtencion de sello (S). 
Supondremos que las probabilidades de C y S son p y q respectivamente, siendo p + q = 1. Asi tenemos 
que P. = p y P .= q. Por otra parte, se debe considerar que C y S se presentan independientemente; 
por tal razon, cualquiera de las puntos muestrales, la probabilidad de que ocurran todos estos sucesos 
en un solo ensayo, se obtiene multiplicando las probabilidades para cada suceso. Supongamos que en el 
lanzamiento de 4 monedas, se quiera obtener exito (cara) en la primera y tercera moneda y fracaso (sello) 
en la segunda y cuarta; se tendra que: 

p ( c5C5) = P (c, p (s) p (c) P ( S) =pqpq = P 2 q 2 

Veamos las probabilidades asignadas a los 16 puntos muestrales del experimento anterior al lanzar 
cuatro monedas. 
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Tabla 6.4 Espacio muestral con asignacion de probabilidades para cada suceso 


p 

(ssss) 

— 

mm 

— 

q 4 

= q 4 

(ssse ) 

— 

qqqp 

— 

qY 

) 


— 

mpq 

= 

q'p ( 


p 

(scss) 

= 

mm 

= 

q'p 

> = Aq p 

p 

(csss) 

= 

pqm 

= 

q 3 p 

) 

p 

(sscc) 

= 

mpp 

= 

2 2 N 

q'p' 


p 

(scsc) 

= 

mm 

= 

q 2 p 2 


p 

1 (sees) 

= 

mpq 

= 

q-p- 

2 2 i 

) = 6 q-p 1 

p 

1 (cscs) 

— 

pqpq 

—— 

q p 


p 

1 (esse) 

= 

pmp 

= 

2 9 

q'p' 


P 

1 (cess) 


ppm 

— 

2 2 

qp » 


p 

(sccc) 

= 

mpp 

= 

qp 3 ' 

j 

p 

(cscc) 

— 

pmp 

— 

qp 3 ( 

f 

p 

1 (eees) 

= 

ppm 

= 

qp 3 [ 

= 4qp 3 

P(cccs) 

— 

pppq 

= 

qp 3 

) 

P(CCCC) 

= 

ppm 

= 

p 4 

= P 4 


Si X representa al numero de exitos (caras) que se desea ocurran, se podra elaborar la siguiente tabla 
de probabilidades. Siendo: p = 1/2 y Q = 1/2. 


Tabla 6.5 Distribucion de probabilidades 


X 

0 

1 

2 

3 

4 -<■ 

- No.de caras 

P (X) 

q 4 

4 q 3 p 

6q 2 p 2 

Aqp 3 

/ 


P (x) 

(i/2) 4 

4(l/2) 3 (1/2) 

6(l/2) 2 (l/2) 2 

4(l/2)(l/2) 3 

(1/2)“ 


P 

l 

4 

6 

4 

1 

=J6 = , 

r (x) 

6 

16 

16 

16 

16 

16 


Recordemos el Binomio de Newton y observemos lo que pasa, si reemplazamos las notaciones 
clasicas de a y b por q y p, que representan las probabilidades de sello y cara. 
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(a+ bY= a n + na n ~ l b + 0 a n ~ 2 b 2 + nn-\ n -2 b 3 

v/ 1x2 1x2x3 

La expansion binomial estara expresada de la siguiente forma: 


+ b n 


q + p 


q + 


1 W‘~ l P + 


v2. 


q r ‘- 2 p 2 + 


+ P n 


Distribucion de probabilidad binomial y su representacion grafica 

Elaboremos la distribucion de probabilidad, con el experimento consiste en el lanzamiento de cuatro (4) 
monedas, para la cual la variable aleatoria discreta este dada por la obtencion de exactitud: cero, uno, 
dos, tres y cuatro caras (X = 0, 1, 2, 3 y 4) 


Tabla 6.6 Distribucion de probabilidades 


X 

PROBABILIDADES 

Fraccidn 

Decimal 

% 

0 

1/16 

0,0625 

6,25 

i 

4/16 

0,2500 

25,00 

2 

6/16 

0,3750 

37,50 

3 

4/16 

0,2500 

25,00 

4 

1/16 

0,0625 

6,25 

Z 

16/16 

1,0000 

100,00 


Figura 6.1 Diagrama de frecuencias 


Porcentaje 

% 

40-- 


X Niimero de caras (exitos) 



Ejemplo 1. Supongamos el lanzamiento de 12 monedas o una moneda lanzada 12 veces. ^Cual es la 
probabilidad de obtener: (a) exactamente 4 caras; (b) exactamente 10 caras?; (c) por lo menos dos caras; 
(d) como maximo 9 caras; (e) mas de 10 caras y menos de 3 caras? 
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a) Exactamente 4 caras 


-1 1_1 
P 2 q 2 2 


i2Yi yn 


+* =4 ) I 4 J\ 2 ) [ 2 
12! 


w = 12 


12! 


X =4 exitos 


P-lT-l 

Ll 6 j [256J 


P (>H x 


X Jf 


v Jr = 4) " 


p (x= 4 )= 4 ^ = 0,1208 = 12,08% 


8 ! 4! 
495 


(12-4)! 4! 

x 10 x 9 xM 


1 ]_ri2xllxl0x9x^flr l 

.096 J - [_ ^fx4x 3x2x1 J L 4.096 


= 495 


1 


4.096 


P ( ^ } =12,08% 


NOta: Con calculadora, se hubiese hecho mas rapido el procedimiento anterior, algo similar se logra 
con el uso de tablas o la aplicacion de Excel, como se vera despues de desarrollar estos ejercicios. 


b) Exactamente 10 caras 

£=0,5 <7=1-0,5=0,5 n= 12 


X=10 


p m=I>v x 


r O=io) : 


12 

10 


0,5) 10 (0,5 ) 2 


P (x=10) - 


12 ! 


T x [(0,0009766)(0,25)] 

( 12 - 10 )! 10 ! 

P (jt=10) =66 (0,00024415) = 0,0161 = 1,61% 

C) Por lo menos dos caras = Como minimo dos caras 

X= 2 , 3, 4, 5, 6 , 7, 8 , 9, 10, 11 y 12 p = 0,5 q = 0,5 

.P 


P(x=io) - 1 , 61 % 


p = p = p + p +p + 

(x >1) (X > 2) (x = 2 ) (x = 3) (x = 4) 


(x =12) 


i = V 


Recordemos que jr | n j p x q n ~ x =; o sea 100%, por lo tanto se tendra que: 


P (x>2) = 1 -[ P (x=0) +P 0=l)] 

\ 0 / . \12 


P (x) = 


p q 


Hx>2 ) 


= 1 - 


WTO® 


l / j \ii 
2 


12 

0 12 y v /v y v y 

v/vyv/J p =99 69% 

p (x>2) =1 - [0,0002+0,0029] = 1 -0,0031 = 0,9969 = 99,69% (x " 2) 


d) Como maximo 9 caras = No mas de 9 caras 
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X = 0, 1,2, 3,4, 5,6, 7, 8 y 9 
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P = P = P +P + P + 

(x<10) (x<9) (x = 0) (x =1) (x = 2) 


Desarrollandolo con el complemento se tendra que: 
p =i-rp +P +P I 

(X < 9) L (X-=10) (X-ll) (X=12) J 


+ P 


( x =9) 


P(x)=| x IP'?" 


(;t=io) + P (*=n) + P (x=i 2 ) 


i 

P = i - [0,0161 + 0,0029 + 0,0002] 


P (x<9) — 1 [ P ( 

P 0<9) =1_ 


>(si* 


12 / j \0 


r (x<9) 

p rx<9) 


= 1 - 0,0192 = 0,9808 = 98,08% 


P (*<9) =98 ’ 08% 


e) Mas de 10 caras y menos de 3 caras 
X= 11 12 0 1 2 


P (l0<x<3) P (ll<*<2) P (ll) + P (l2) + P (0) + P (0 + P (2) 

P (n<x< 2 ) =f n )(0,5)' (0,5) + fj 2 W 2 (0,5)° +p 0 2 l(0,5)P (0,5) 


12 J(0,5) (0,5)" +^J(0,5) 2 (0,5f 

p (n<*< 2 ) =0,0029 + 0,0002 + 0,0002 + 0,0029 + 0,0161 = 0,0223 = 2,23% 

p (n < x < 2 ) = 2,23% 


E jemplo 2. Una institucion universitaria establece nuevos metodos de aprendizaje y de evaluacion, con el 
resultado donde el 85% de sus alumnos aprueban todas las asignaturas. Supongamos que se seleccionan 
8 estudiantes de dicho plantel ^Cual es la probabilidad: (a) exactamente 3 aprueben todas las asignaturas; 
(b) exactamente 3 pierdan alguna asignatura; (c) por lo menos dos pierdan alguna asignatura? 


o : (a) Exactamente 3 aprueben 
p = 0,85 (aprobar) n = 8 X = 3 


( =3) “ 


\ 

(0,85^ (0,157 = 0,0026 = 0,26 

J 


Se pueden utilizar las tablas de binomial que aparecen al final del libro correspondiente a la tabla III 


□ Se busca en la primera columna de la tabla que aparezca el valor de D = 8 (Ver tabla 6.5). 

□ Luego en la segunda columna el valor de X. 

□ Se localiza 0,85 en el renglon de p, observemos que se llega a 0,50, por lo tanto se toma el 
complemento de 0,85 siendo 0,15. 

□ Observemos en la tabla al frente de 5 y en la columna 0,15 aparece 0,0026. 


Como nos piden que 3 aprueben, es lo mismo que decir, 5 pierdan alguna asignatura, 
siendo: n = 8 p = 0,15 X = 5 
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P (x=5) =^J(0,15) 3 (0,85) 5 =0,0026 = 0,26% 

Como observamos el resultado es igual al anterior 
b) Exactamente 3 pierdan alguna asignatura 
n = 8 p = 0,15 q = 0,85 X = 3 

P (x=3) = ^ j (0,15) 3 (0,85) 5 = 0,0839 = 8,39% . 

De acuerdo a la Tabla 6.5, al frente de 3 y debajo de la columna 0,15 aparece el valor de 0,0839 


Tabla 6.5 Distribucion binomial. Cuando n = 8 




P 

n 

X 

.05 

.10 


.20 

.25 

.30 

.35 

.40 

.45 

.50 

8 

0 

.6634 

.4305 

.2725 

.1678 

.1001 

.0576 

.0319 

.0168 

.0084 

.0039 


l 

.2793 

.3825 

.3847 

.3355 

.2670 

.1977 

.1373 

.0896 

.0548 

.0312 


2 

.0515 

.1488 

.2376 

.2936 

.3115 

.2965 

.2587 

.2000 

.1569 

.1094 


ryi 

i_Aj 

.0054 

.0331 

[70839] 

.1468 

.2076 

.2541 

.2786 

.2787 

.2568 

.2188 


4 

.0004 

.0046 

.0185 

.0459 

.0865 

.1361 

.1875 

.2322 

.2627 

.2734 


r <l 

lAj 

.0000 

.0004 

[7)026j 

.0092 

.0231 

.0467 

.0808 

.1239 

.1719 

.2188 


6 

.0000 

.0000 

.0002 

.0011 

.0038 

.0100 

.0217 

.0413 

.0703 

.1094 


7 

.0000 

.0000 

.0000 

.0001 

.0004 

.0012 

.0033 

.0079 

.0164 

.0312 


8 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0002 

.0007 

.0017 

.0039 


c) Por lo menos dos pierdan alguna asignatura 


P (x>2) = 1 - [ P (x=0) + P (x=l) ] (Observar Tabla 6.5) 

P (x> 2 ) = 1 - [0,2725 + 0,3847] 
p (x>2)= 1 - 0,6572 = 0,3428 = 34,28% 


Alfinal del libro sepresenta una tabla dondep va desde . 05 hasta .95 lo cual ayuda a simplificar elproceso. 


APLICACION DEL EXCEL 



DISTRIBUCION BINOMIAL 

□ Nos ubicamos en fx haciendo CLIC en DIST.BINOM y nuevamente CLIC en ACEPTAR. 

□ Aparece la figura correspondiente a DIST.BINOM. N, alii nos ubicamos en NUM-EXITO en 


esta celda digitamos el valor de X=2 (el numero de exitos es 2). 


□ Luego en la celda correspondiente a ENSAYOS, digitamos el valor n siendo en este caso igual 
a 5 (numero de repeticiones). 

□ Se procede luego a digitar el valor correspondiente a PROBEXITO, siendo igual a 0.6 (p=0.6). 
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Figura No. 1. Insertar Funcion 
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□ En la casilla de ACUMULADO (es un valor logico) en este caso, si digitamos la palabra 
VERDADERO obtendremos la probabilidad de 0.31744, correspondiente a la obtencion de 
maximo 2, en este caso X toma valores de 0, 1 y 2 siendo P (x < 2). 


Figura No. 2. Argumentos funcion Distribucion Binomial. Parametro Verdadero 
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Areumentos de funcion 






5 













6 



DISTR.BINOM.N 






7 



[ 

Num_exito 2 [pjg] = 2 







8 



Ensayos 5 [36] = S 





9 



Prob_exito 0,6 [36] = 0,6 




10 



Acumulado verdadero [36] = VERDADERO 






11 

12 



= 0,31744 

)evuelve la probabilidad de una variable aleatoria discreta siguiendo una distribucion binomial. 

Acumulado es un valor logico: para usar la funcion de distribucion acumulativa = 
VERDADERO; para usar la funcion de probabilidad bruta = FALSO. 
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tesultado de la formula = 0,31744 
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tyuda sobre esta funcion ( Aceptar | [ Cancelar ) 
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En la SEGUNDA PARTE DEL SIL queacompa a al libro encontrara en conjunto toda la aplicacion deEXCELala 
ESTADfSTICA, al igual en el capitulo 13, se ofrece una BASE DE DATOS paratrabajar. 
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□ Si por el contrario digitamos FALSO, en vez de VERDADERO, se calculara la probabilidad de 
obtener EXACTAMENTE DOS. 


Figura No. 3. Argumentos funcion Distribution Binomial. Parametro Falso. 


(21 U *9 - -1 - borrador 82 - Microsoft Excel 
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;$r 
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DISTR.BINOM.N * ( m X ✓ fx =DISTR.BINOM.N(2;5;0,6;falso) 




0,6;falso) 


Argumentos de funcion 


M 


Num exito 2 


Ensayos 5 

lal- 5 

Prob_exito 0,6 

SI = 0,6 

Acumulado falsoj 

(g = FALSO 


= 0,2304 

Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribudon binomial. 


Acumulado es un valor logico: para usar la funcion de distribudon acumulativa = 
VERDADERO; para usar la funcion de probabilidad bruta = FALSO. 


Resultado de la formula = 0,2304 

Avuda sobre esta funcion 


Hojal 1 Hoja2, Hoja3 , tJ 




|IQ1 ioo‘ 


□ Observemos que en la parte inferior, aparece el valor de 0.2304 cuando escribimos FALSO, 
proceso utilizado cuando se quiere calcular cada termino en forma independiente. Si por el 
contrario se escribe VERDADERO sera el resultado igual a 0.31744, este caso implicara el 
acumulado de varios valores de X. 


Ejemplo 4. Se encuentran 5 amigos cierto dia ^Cual es la probabilidad (a) por lo menos dos de ellos 
hayan nacido un martes?; (b) ^Si el grupo lo conforman 40 amigos, cuantos esperariamos hubiesen 
nacido el dia lunes? 

USO DE CALCULADORA 


Para hallar la probabilidad de un suceso en la binomial se presentan algunas marcas y modelos que mas 
se utilizan en el salon de clases. 

o 


a ) P(x>2) ~ P(x=2) + ^(x = 3) + P(x=4) + ^(x = 5) 

P ( x>-2) = 1 - [P (x = o) + P(x=\) ] = 1 - [0,4627 + 0,3856] 

P(x> 2) = 1 — 0,8483 

P(x>2) = 0,1517 = 15,17% 


b) E = np 

n= 40 p = 1/7 

E =40(1/7) = 5,7 = 6 
Aproximadamente 6 personas de las 40 
se espera haber nacido el dia lunes. 
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Casio fx - 5.000F 

□ Se digita el codigo de la formula binomial ( 103 FMLA ) 

□ Observe en pantalla donde nos pide n? (digite en este caso 5 y luego EXE ) 

□ Aparece p? es la probabilidad de exito (podemos digitar 1 4 7 y luego EXE ) 


□ Observamos que nos aparece el resultado final del evento, siendo 0,4627 


P 

(x=0) 


(1/7)° (6/7 ) 5 = 0,4627 = 46,27% 


Casio fx - 350 TL y Casio fx - 82 TL, con ellas se procede asi: 


5 

nCr 

0 

X 

( 

1 

-i- 

7 

1 


x y 

0 

X 

( 

6 

= 7 ) xy 5 

= 


Casio -350 M5 opera igual a los dos anteriores modelos, con la unica diferencia, que no aparece la 
tecla x y y debe ser reemplazada por la tecla A que indica lo mismo. 


Casio 350 HB requiere emplear la tecla SHIFT y luego x y los demas pasos o tecleado es igual. 
Casio 991 MS tiene dos situaciones diferentes, asi: 


5 SHIFT nCr 0 x ( U7A) A 0 x ( 6 = 7 ) A5 = 


En muchas calculadoras que no tienen la tecla nCr se debe operar paso a paso ( ( 5 ! -r 


( 0 ! x 5 ! ) ) x ( 1/7 x y 0 ) x ( 6/7 x y 5 ) = 


E jemplo 5. A1 inspeccionar 2.340 soldaduras producidas por cierto tipo de maquina, se encontraron 448 
uniones defectuosas. A1 efectuar 5 soldaduras ^cual es la probabilidad de: a) obtener 3 o mas defectuosas; 
b) Como maximo dos buenas? 

o 


a) n =5 


448 n, 

p= -= 0,1 

2.340 


g=0,81 X =3,4,5 


! U>3) 


( 0,1 f (0,81 ^ + [ 5 1 ( 0,1 f (0,81) + 5 I ( 0,1 f ( 0,81 )P 


[ U>3) 


= 0,0450 + 0,0053 + 0,0002 = 0,0505 = 5,05 


b) n=5 p= 0,1 


2 = 0,1 


X =0,1,2 


x<2 


x<2 


5 

=0,0002 + 0,0053 + 0,0450 = 0,0505 = 5,05 


(o, i y (0,1 y +P)(o, i) (0,1 y + y 2 (o, if (0,1 y 


Nota: Puede observarse en el ejercicio que obtener 3 o mas defectuosos, es lo mismo que obtener 2 o 
menos buenos. 


REPRESENTACION GRAFICA 

Una distribution binomial se representa mediante el diagrama de probabilidades , el proceso es exacta- 
mente igual al diagrama de frecuencias. 

Las figuras 6.2 y 6.3 nos muestran varias distribuciones probabilisticas binomiales, ademas, per- 
miten demostrar como se vuelven mas simetricas,tal como 10 podemos ver en los dos casos siguientes. 
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a) Cuando es constante y se hace cada vez mas grande, hasta llegar a 0,50 = 50%. Supongamos 
que = 8 y que toma valores de 0,10 0,20 0,30 y 0,50 

Para encontrar una forma mas rapida, sin necesidad de realizar calculos engorrosos al aplicar la 
formula de la binomial, podemos hacer uso de la tabla de distribucion binomial, que se presenta 
en la tabla III cuando n = 8, siendo p: 0,05; 0,10; 0,15; 0,20; 0,25; 0,30; 0,35; 0,40; 0,45 y 0,50 



Figura 6.2 Diagrama de frecuencias 
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b) Cuando p es constante y D se hace cada vez mas grande. Supongamos que p = 0,10 y n toma 
valores de 5, 10, 20 y 40. 


Figura 6.3 Diagrama de frecuencias 
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EJERC 1C IQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

1. A1 lanzar cuatro monedas, ^cual es la probabilidad de obtener exactamente dos caras? 

2. Si en el ejercicio anterior, solo queremos determinar la probabilidad de que aparezcan exactamente 
3 caras. 

3. En el caso de un dado, se quiere determinar la probabilidad de obtener exactamente 2 cincos en 4 
lanzamientos. 

4. En una facultad, la probabilidad de que un alumno apruebe el semestre es del 80%. Si consideramos 
8 alumnos, ^Cual es la probabilidad de que: 

a) dos ganen. b) dos pierdan. c) por lo menos dos pierdan. 

d) como maximo 6 ganen. e) seis pierdan el semestre? 

5. Se lanza 6 veces una moneda. Encontrar la probabilidad de obtener: 
a) exactamente 4 caras. b) maximo 4 caras. 

6. Se lanzan 7 dados. Si el exito consiste en sacar un 5 6 6, encontrar la probabilidad de obtener: 
a) exactamente 4 exitos. b) maximo 4 exitos. 

7. Se sabe que en la manufactura de cierto articulo, uno de cada 10 resulta defectuoso. ^Cual es la 
probabilidad de que una muestra aleatoria de 4 articulos contenga: 

a) ninguno defectuoso. b) exactamente uno defectuoso. 

c) exactamente dos defectuosos. d) no mas de dos defectuosos? 

8. Si un jugador que al batear tiene un promedio de 0,40, llega a batear 5 veces en un juego, ^Cual es 
la probabilidad de que obtenga: 

a) exactamente dos golpes. b) menos de dos golpes? 

9. Al lanzar 8 monedas, ^cual es la probabilidad de obtener menos de 6 caras? 

10. Segun los registros universitarios, fracasa el 5% de los alumnos de cierto curso. ^Cual es la 
probabilidad que de 6 estudiantes seleccionados al azar, que hayan seguido dicho curso, menos de 
3 hayan fracasado? 

11. Los registros hospitalarios indican que el 10% de los casos de cierta enfermedad resultan fatales. Si 
hay 5 pacientes que sufren de la enfermedad, encontrar la probabilidad de que: 

a) todos sanen. b) por lo menos tres mueran. c) exactamente 3 mueran. 

12. Si el 20% de los cerrojos producidos por una maquina son defectuosos, determinar la probabilidad, 
que de 4 cerrojos elegidos al azar, 

a) uno. b) cero. c) no mas de dos cerrojos sean defectuosos. 

13. La probabilidad de que se gradue un estudiante que ingresa a una universidad es de 0,4. Calcular la 
probabilidad entre 5 estudiantes que ingresan. 
a) ninguno se gradue. b) se gradue uno. 



c) se gradue al menos uno. 
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14. Un dado se lanza cinco veces. Calcular la probabilidad de que el 3 aparezca: 

a) una vez. b) dos veces. c) tres veces. d) cuatro veces. e) ninguna vez. 

15. El 10% de los articulos producidos mediante cierto proceso son defectuosos (no aceptables). Si se 
toma, al azar, una muestra de cuatro articulos, ^cual es la probabilidad de que contengan: 

a) ninguno defectuoso. b) al menos uno defectuoso. c) menos de dos defectuosos? 

16. En una fabrica el 20% de los articulos que produce cierta maquina resultan defectuosos. Si 10 
articulos son elegidos al azar, de todos los producidos en el dia por dicha maquina, calcular la 
probabilidad de que haya: 

a) exactamente dos defectuosos. b) 3 6 mas defectuosos. 
c) mas de cinco defectuosos. d) ninguno defectuoso. 

17. Suponga que la mitad de los habitantes de cierto pueblo ven regularmente television. De 100 
investigadores, cada uno encuesta a 10 personas. /,Cuantos se espera que mencionen 3 o menos que 
sean televidentes regulares? 

18. En promedio cierto estudiante puede resolver la mitad de los problemas que se le presentan; para 
aprobar es necesario solucionar 7 de 10 problemas de un examen. ^Cual es la probabilidad de que 
el estudiante apruebe el examen? 

19. En promedio el 10% de las varillas de madera usadas en cierto producto se encuentran demasiado 
nudosas para ser usadas. ^Cual es la probabilidad de que en un paquete de 15 varillas: 

a) exactamente 5 esten demasiado nudosas. b) por lo menos 10 esten demasiado nudosas. 

c) mas de 4 esten demasiado nudosas? 

20. Por regia, el 25% de ciertos productos manufacturados por un cierto tomo, son defectuosos. /,Cual 
es la probabilidad de que en 20 de estos productos haya: 

a) exactamente 15 defectuosos. b) menos de 5 defectuosos. c) por lo menos 8 defectuosos? 

21. De un total de 2.000 familias con 4 hijos cada una, ^en cuantas de ellas cabe esperar que haya: 
a) al menos 1 nino. b) 2 ninos. c) ningun nino? 

22. Siendo n = 15 p = 0,05, hallar la probabilidad de 2 o menos acontecimientos favorables. 

23. Si el 40% de los votantes de una gran ciudad favorecen al candidato A, ^cual es la probabilidad para 
que, en una muestra al azar de 20 votantes, la mayoria favorezca al candidato A? 

24. Supongamos que Jorge dispara su revolver 18 veces, ^cual es la probabilidad de que logre 
exactamente 8 centros, sabiendo que la probabilidad de que logre centro es de 0,20? 

25. Diez monedas son extraidas del bolsillo de una persona y puestas sobre una mesa. ^Cual es la 
probabilidad de que el numero de caras este entre 5 y 7 inclusive? 

26. ^Cual es la probabilidad de contestar correctamente, por lo menos tres de las cinco preguntas de un 
test de falso y verdadero? 

27. Si se sabe que nueve de cada diez personas tienen caries, al tomar al azar un grupo de cinco personas, 
^cual es la probabilidad de que: 
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a) cuatro tengan caries. 

c) por lo menos dos no tengan caries. 


b) por lo menos dos tengan caries, 
d) por lo menos una tenga caries? 


28. Si el 20% de los estudiantes de una universidad pierden el primer ano y se toma al azar un grupo de 
seis estudiantes, ^cual es la probabilidad de que: 

a) maximo dos aprueben. b) todos aprueben. c) ninguno apruebe? 

29. De los 6.000 estudiantes matriculados en la universidad, se sabe que 4.800 se trasladan al claustro 
utilizando el transporte urbano (servicio publico). Si se selecciona una muestra de ocho estudiantes, 
^cual es la probabilidad de que: 

a) no mas de dos utilicen dicho servicio. b) por lo menos tres no lo utilicen. 

c) exactamente dos no lo utilicen. d) exactamente dos lo utilicen? 

30. Se sabe que el 60% de los alumnos de una universidad asisten a clases el dia viemes; en una 
encuesta a ocho alumnos de la universidad, ^cual es la probabilidad de que: 

a) por lo menos 7 asistan a clase el dia viemes. 

b) por lo menos dos no asistan a clases el dia viernes? 

31. Se sabe que en una universidad de 2.000 estudiantes, ochocientos usan gafas. Si se realiza una 
encuesta a cinco estudiantes, ^cual es la probabilidad de que: 

a) por lo menos dos usen gafas. b) por lo menos dos no usen gafas. 

c) de 2.000 estudiantes, ^cuantos no usan gafas? 

32. Si un tercio de los estudiantes de un curso de contabilidad son repitentes, calcule la probabilidad de 

que en una muestra al azar de cuatro estudiantes: 

a) no mas de dos sean repitentes b) al menos uno no sea repitente. 

33. /,Cual es la probabilidad de que se produzcan diez o mas acontecimientos desfavorables en 16 
ensayos de una experiencia binomial, si la probabilidad de acontecimiento favorable en cada ensayo 
es de 0,4? (Utilice las tablas para el calculo). 

34. Una compania de seguros considera que alrededor del 25% de los carros de servicio publico se 
accidentan cada ano. ^Cual es la probabilidad de que por lo menos tres de una muestra de siete 
vehiculos afiliados, hayan tenido accidentes en el ano? 

35. De la produccion de envases metalicos en una fabrica, se sabe que el 3% son defectuosos. ^Cual es 
la probabilidad de que en una muestra de siete envases: 

a) por lo menos tres sean buenos. b) por lo menos tres sean defectuosos? 

36. Si la probabilidad de que un nino enferme de sarampion es de 1%, ^cual es la posibilidad de que en 
una familia con cinco hijos, resulten: 

a) dos enfermos. b) por lo menos uno enfermo. c) por lo menos dos no se enfermen? 

37. Cierta enfermedad tiene un 20% de mortalidad. Si existen cinco pacientes con la enfermedad, ^cual 

sera la probabilidad de que: 

a) ninguno sobreviva. b) todos sobrevivan. 

c) al menos uno sobreviva. d) al menos uno no sobreviva? 
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38. En una ciudad se publican 25 revistas de las cuales cinco son cientificas. Si se eligen cuatro al azar, 
^cual sera la probabilidad de que: 

a) por lo menos una sea cientifica. b) por lo menos dos no sean cientificas. 

c) una sea cientifica? 

39. El 30% de las familias de un barrio de Quito, son consideradas posibles clientes para comprar cierto 

producto. Se toma una muestra de ocho familias. ^Cual es la probabilidad, en la muestra, de que: 
a) tres o menos sean clientes. b) tres o mas no sean clientes? 

40. Los dos quintos de los votantes inscritos en ciertos barrios de Bogota apoyan al grupo A. ^Cual es 
la probabilidad de que en una muestra de siete votantes de ese puesto de votacion: 

a) exactamente cinco apoyen a A. b) por lo menos dos apoyen a A. 

c) por lo menos dos no apoyen a A? 

41. Un examen de tipo verdadero-falso, contiene 16 preguntas; suponiendo que un alumno conteste 
cada pregunta al azar, ^cual es la probabilidad de que: 

a. A lo mas dos preguntas sean contestadas correctamente. 

b. Por lo menos dos preguntas sean contestadas correctamente. 

c. Por lo menos dos no sean contestadas correctamente? 

Nota: se puede utilizar la tabla 

42. En la produccion de un determinado articulo encontramos que por cada veinte que se producen, tres de 
ellos resultan defectuosos. Si se toma una muestra de ocho articulos, ^cual es la probabilidad de que: 

a) por lo menos dos sean defectuosos. 

b) por lo menos dos no sean defectuosos. 

c) En una produccion de 2.000 articulos, ^en cuantos de ellos esperamos que dos sean 
defectuosos? 

43. Se sabe que el 70% de los miembros de la universidad son fumadores; en una muestra aleatoria de 
18 fumadores, ^cual es la probabilidad de que haya exactamente 16 fumadores? (utilizar la tabla). 

44. Una firma de pedidos por correo, envia una circular y espera una tasa de respuesta del 20%; suponga 
que diez circulares se envian como prueba de mercado en una nueva area geografica. Si se aplica la 
tasa de respuestas del 20% en la nueva region, determine la probabilidad de que: 

a) la mayorfa responda b) menos del 30% de la gente no responda c) nadie responda. 

45. El 17 % de los articulos producidos mediante cierto proceso, son defectuosos. Se toma al azar una 
muestra de diez articulos, ^cual es la probabilidad de que: 

a) ninguno sea defectuoso. b) por lo menos dos no sean defectuosos. 

c) como maximo dos sean defectuosos? 

46. Existe un 80% de probabilidad de que un tipo determinado de componentes se comporte 
adecuadamente bajo las condiciones de alta temperatura. Si el dispositivo en cuestion tiene cuatro 
de tales componentes, determine la probabilidad en cada uno de los siguientes eventos, por medio 
de la formula para probabilidades binomiales: 

a) todos los componentes se comportan adecuadamente y por lo tanto el dispositivo es operacional. 
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b) el dispositivo no es operacional porque falla uno de los cuatro componentes. 

c) el dispositivo no es operacional porque falla uno o mas de los componentes. 

47. Suponga que un conductor de automovil que maneja con exceso de velocidad, puede ser detectado 
por un sistema de radar. Se dice que de cada diez con exceso de velocidad, seis son detectados. Un 
automovilista va con exceso de velocidad, en viaje entre Bogota y Tunja. Durante el trayecto hay 
ocho estaciones de vigilancia por radar. 

a) ^Que probabilidad hay de que este automovilista, por lo menos cinco veces sea detectado con 
exceso de velocidad? 

b) /,Por lo menos dos no sean detectados? 

48. Se sabe que la probabilidad de que una familia tome jugo de naranja en el desayuno es del 9,9%. Se 
toma una muestra de cinco familias y se quiere determinar la probabilidad de que: 

a) por lo menos dos familias tomen jugo de naranja al desayuno. 

b) como maximo tres familias no tomen jugo de naranja al desayuno. 

49. Un vendedor supone que cada entrevista le produce una venta con probabilidad de l A. En un 
determinado dia el vendedor entrevista cinco posibles clientes. /,Cual es la probabilidad de que por 
lo menos tres compren? 

50. Supongamos que el 16% de los estudiantes que se presentan a un examen de estadistica, con menos 
de tres ausencias, en el semestre, lo pierden. Si se seleccionan 10 estudiantes con menos de tres 
ausencias, ^cual es la probabilidad que no lo pierda un numero de alumnos no mayor a cinco ni 
menor a tres? 

51. Una secretaria que debe llegar a su trabajo todas las mananas a las 8:00 se tarda como minimo 15 
minutos, el 20% de las veces. El jefe de la oficina, que no llega sino a las 9:00, la mayoria de las 
veces, llama ocasionalmente entre las 8:00 y las 8:15 para enterarse de las novedades. 

a. ^Cual es la probabilidad, en dos mananas de las cinco de la semana, que el jefe llame y la 
secretaria no este en la oficina? 

b. ^Que por lo menos dos mananas de las cinco, la secretaria este? 

52. En una poblacion de trabajadores del Estado, que gozan pension de jubilacion, el 36% tiene mas de 
65 anos. ^Cual es la probabilidad, en una muestra de 18 pensionados, de que 15 o mas tengan mas 
de 65 anos? 

53. La oficina de personal en una fabrica, indica que el 30% de los empleados de la linea de montajes 
se retiran durante los primeros tres anos de haber sido contratados. Se acaban de contratar 12 
empleados nuevos. ^Cual es la probabilidad de que: 

a) por lo menos nueve sigan trabajando despues del tercer ano. 

b) como minimo tres se retiren antes del tercer ano? 

54. Si se sabe que uno de cada diez libros de texto representan un exito financiero y una casa editora ha 
decidido publicar seis textos nuevos, ^cual es la probabilidad de que por lo menos dos sean un exito 
financiero? 

55. En una region se tienen 25 colegios de ensenanza secundaria, de los cuales cinco son tecnicos. Si se 
eligen al azar cuatro colegios, ^cual es la probabilidad de que: 

a) por lo menos uno sea tecnico. b) por lo menos dos no sean tecnicos? 
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DISTRIBUCION PROBABILISTICA DE POISSON 


En una distribution binomial cuando es grande, por lo general mayor de cincuenta, y , la probabilidad 
de exito de un suceso, se acerca a cero, mientras que la probabilidad de fracaso se aproxima a 1, de 
tal manera que el producto de , simbolizado por lambda X, sea menor o igual a 5, debe utilizarse 
la distribution de Poisson. Algunos autores, consideran no solo el hecho de que sea muy pequena, 
sino tambien cuando es tan grande que se aproxima a 1, y X < 5, en ambos casos, se puede aplicar 
esta distribucion. La tabla que se adjunta al final da la opcion donde 5c < 10, como algunos lo aceptan, 
contrario a un valor menor o igual a 5. 


Su formula es: 



X x e~ l 

X! 


Siendo 


e = 2,71828 ( base de los logaritmos neperianos ) 
A = np 

X = numero de casos favorables 


P (x) = Probabilidad que se va a calcular para un valor dado de X 


Generalmente se dice, que la distribution de Poisson tiene su mayor aplicacion, cuando en el ex- 
perimento que se realiza ocurren sucesos llamados raros, los cuales se identifican con una probabilidad 
de exito sumamente pequena (p) y el numero de observaciones (n) grande; pero la verdad es que esta 
distribucion se aplica a una variedad de situaciones diferentes, como las ocurrencias respecto a un campo 
continuo, como area o tiempo. Algunos de estos eventos aleatorios ocurren en forma independiente a una 
velocidad dentro de un campo o intervalo, generalmente de espacio (area y tiempo). 


Son ejemplos para aplicacion de la distribution de Poisson: el numero de personas 
que llegan a un almacen, banco o aeropuerto en un tiempo determinado; el numero 
de llamadas telefonicas por minuto; el numero de defectos en piezas similares 
en el material, ya sea por centimetro cuadrado o centimetro lineal; numero de 
bacterias en un cultivo; insectos por kilometro cuadrado; el numero de fallas de 
una maquina durante una hora o un dia; el numero de accidentes por dia; el numero 
de reclamaciones o solicitudes a una compania de seguros en un determinado 
perfodo, etc. Como se puede observar, se trata de hallar la probabilidad de 
ocurrencia de cualquier numero de exitos (X) por unidad de medicion (minuto, 
hora, dia, centimetro, metro, etc.). Algunos de los ejercicios que se daran para su 
solucion, solo tendran el valor del parametro lambda (X) o sea el pro medio 0 razon 
de ocurrencia del evento aleatorio por unidad de tiempo o espacio y el numero de 
exitos que se solicitan, por lo tanto no habra necesidad de conocer los valores de 
p y de n. 


E j em p 10 1. Si el 1 % de las bombillas fabricadas por una compania son defectuosas, hallar la probabilidad 
de que, en una muestra de 100 bombillas, 3 sean defectuosas. 

o 


X= 100(0,01)- 1 


X=3 
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P 


x=3 



1(0,367 
3 2 1 


) 


= 0,06131 = 6,13 


Ejemplo 2. Si la probabilidad de que una persona adquiera la enfermedad como consecuencia de una 
vacuna contra la misma, es 0,0002, i cual es la probabilidad de que la adquieran exactamente 5 personas 
en una poblacion de 10.000 vacunados? 


X= 10.000(0,0002) = 2 X= 5 
32 (0,13534) 


P(x=5) 


2 V 2 


120 


0,0360 


5 ! = 5. 4.3. 2.1 = 120 


‘ (*= 5 ) 


3,61 


Ejemplo 3. Se estima que una de cada 10.000 personas es alergica a cierta sustancia utilizada en la 
fabrication de tintes para el cabello. ^Cual es la probabilidad de que en 20.000 usuarias de tintes, mas de 
cinco sufran reacciones alergicas, debido a su uso? 


o 


P = 


1 

10000 


= 0,0001 


A = np= 20000 0,0001=2 


P 


x>6 


2V 2 2V 2 2 2 e~ 2 2 3 e~ 2 2V 2 2V 2 

012 3 4 5 


„ 10,13534 , 2 0,13534 , 4 0,13534 , 0,13534 , 16 0,13534 , 32 0,13534 

xi6 ( 1+ 1 + 2 + 6 + 24 + 120 

P x . > 6 =1-0, 344= 0,01656=166 


El valor de S" x se calcula generalmente mediante el uso de la calculadora, cuyo procedimiento varia 
de acuerdo a su marca y modelo: 


USO DE CALCULADORA 


Casio fx - 5.000F (y en la mayorfa de modelos) se procede asi: 

0,135335283 


SHIFT e x (-) 3 EXE 


Tambien mediante el uso de tablas (ver al final del libro tabla VII) 


Ejemplo 4. El numero de Clientes que llegan a una corporacion de ahorro y vivienda los dias sabados 
es, en promedio, 40 por hora ^Cual es la probabilidad de que lleguen por lo menos dos clientes (a) en un 
periodo de 14 minutos; (b) en 5 minutos? 


o : utilizaremos la tabla para calcular la probabilidad en cada suceso. 

a) 2 = 40 A =— xl4= ,33 ,3 


Px>2 l/\ = 0 + ^\=l] 


P =1- 

x>2 


,3>e- 3 


+ • 


,3e~ 3 


1 -[ 0 , 0001 + 0,000 ] 


P xi 2 =1-0,000 =0, 1= , 1 
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Tabla 6.6 Distribucion de Poisson 



X 

X 

9.1 

9.2 

9.3 

9.4 

9.5 

9.6 

9.7 

9.8 

9.9 

10.0 

0 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0001 

0,0000 

1 

0,0010 

0,0009 

0,0009 

0,0008 

0,0007 

0,0007 

0,0006 

0,0005 

0,0005 

0,0005 

2 

0,0046 

0,0043 

0,0040 

0,0037 

0,0033 

0,0031 

0,0029 

0,0027 

0,0025 

0,0023 

3 

0,0140 

0,0131 

0,0123 

0,0115 

0,0100 

0,0100 

0,0093 

0,0087 

0,0081 

0,0076 

4 

0,0319 

0,0302 

0,0285 

0,0269 

0,0254 

0,0240 

0,0226 

0,0213 

0,0201 

0,0189 


b) A = 40 


A = ^-x5 = 3,33 
60 


' (*22) 


= 1 


3,3° e~ 3,3 3,3 1 e~ Xi 

+ ^T“ 


1-[0,036 +0,1217] 


p (x>2) =1-0,1586 = 0,8414 
P =8414 

r (x>2) ’ 


3,3 


Tabla 6.6A Distribucion de Poisson 


Esta tabla solo sirve 
cuando se tiene 
un solo decimal; 
como se observa, y la 
empleamos cuando 
X = 3,3 y no para X = 3,33 


X 

X 

3.1 

3.2 

3.3 

3.4 

3.5 

3.6 


0 

0,0450 

0,0408 

0,0369 

0,0334 

0,0302 

0,0273 

1 

0,1397 

0,1304 

0,1217 

0,1135 

0,1057 

0,0984 

2 

0,2165 

0,2087 

0,2008 

0,1929 

0,1850 

0,1771 

3 

0,2237 

0,2226 

0,2209 

0,2186 

0,2158 

0,2125 

4 

0,1734 

0,1781 

0,1923 

0,1858 

0,1888 

0,1912 


Nota\ Si se hubiese trabajado correctamente con X = 9,33 y 3,33, los resultados respectivos sedan: 

j0- ,33 qqI^-,33’ 


a ) P x>2 =1 


,33 e“ ' JJ ,33 e“ 
- + - 


0 


1 


P x>2 =1-0,000 =0, 1= , 1 


3,33 e ’ | 3,33 e 


1 „-3,33 


b) P x >2 =1- 


p x>2 =1-0,1550 = 0, 450= 4,50 


:1-[0,0000 +0,000 3] 


= 1-[0,035 +0,11 2] 


E jemplo 5. Supongamos que - 2 y deseamos hallar la P cuando x = 0, 1, 2, 3 y 4 


(X) 

p =p +p +p +p +p 

(x<4) A (x = 0) (x=l) (x = 2) (x=3) (x = 4) 


r APLICACION DEL EXCEL 



Las operaciones se haran mas rapido y mas confiable su resultado utilizando el 
programa Excel. Veamos en nuestro ejercicio como se opera: 
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□ INuevamente nos ubicamos en la funcion fx, haciendo CLIC en ella, tal como hicimos en la 
distribucion binomial, solo que ahora hacemos CLIC en POISSON, tal como se presenta en la 
aplicacion siguiente: 


Figura No. 4. Insertar Funcion. 


®l H ^ w I” Librol - Microsoft Excel 

|J Inicio | Insertar Diseno de pagina Formulas Datos Revisar Vista 
Pi * Calibri 
p egar ^ H AT S " 

Portapapeles n [Fu 


= [£PS3 

^ a $ H 


- A" A 

<3* - A 


- 

General 

ISsI Formato condicional » 

Insertar * 

I - 

m m m 

Sf - % 000 

ijgl Dar formato comotabla - 

Ef* Eliminar - 

j- 

w iw 

*08 -*°o 

[gr Estilos de celda - 

tgjl Formato 

a- 

| Alineacidn r« 

Numero r; | 

Estilos 

Celdas 



Ordenar Buscary 
yfiltrar" seleccionar - 
Modificar 


• * ^ f- z 


JZ 


Insertar funcion 


Buscar una funcion: 


Escriba una breve description de lo que desea hacer y, a 
| continuacion, haga die en Ir 

_1 

O seleccionar una categoria: | Estadisticas | v | 



PENDIENTE 
PERCENTIL.EXC 
PERCENTIL.INC 
PERMUT ACIONES 


- 


POISSON.DIST (x;media;acumulado) 

Devuelve la distribucion de Poisson. 


Ayuda sobre esta funcion 


J3I 


I Ace P tar I L 


h Hojal Hoja2 Hoja3 ?3 


JLlL 


I a ora 100% 0 g 






9:32 


□ A1 presionar ACEPTAR aparece un cuadro de dialogo para lo cual en la casilla X digitamos el 
numero correspondiente de exitos, en este caso 4. 

□ En la siguiente casilla o renglon aparece la palabra MEDIA, digitamos el valor correspondiente 
a lambda X siendo igual a 2. 

□ Nos queda por ultimo el renglon ACUMULADO que corresponde a un valor logico. Si digitamos 
en el, la palabra VERDADERO, nos estaremos refiriendo a la probabilidad de obtener como 
maximo, en este caso cuatro (4), como se presenta a continuacion: 


Figura No. 5. Argumentos de la Funcion. Parametro Verdadero 


■I a *• q* 


Librol - Microsoft Excel 


Insertar Diseno de pagina Formulas Datos Revisar 


a @ S3 


oi. 

Pegar 

Portapapeles ri 


- 11 - A* 

— = = m 1 

General » 

L^j Formato condicional * 

Insertar • 

r £r a 


== m == 

S| % 000 

fijjl Dar formato comotabla * 

H* Eliminar 

3- * 

H AT S [H ' & A 

W iw 1 

*oo -°8 

6^ Estilos de celda " 

{jjrl Formato * 

Ordenar Buscary 
'-t w yfiltrar - seleccionar 

Fuente 

Alineacion ri 

Numero li 

Estilos 

Celdas 

Modificar 


POISSON.DIST - - : 

X ✓ fic =POISSON.DIST(4;2;verdadero) 

“0 



A 

B 

C D E F G H 1 J 

1 K 

L 

L=. 

1 

>rdadero) 







2 







3 



Argumentos de funcion [T1S 













4 









5 



'POISSON.DIST 





6 



X 

II 

-A 





7 



Media 2 (®] = 2 





8 



Acumulado verdadero [SsJ = VERDADERO 





9 



= 0,947346983 

Devuelve la distribucion de Poisson. 





10 








11 



Acumulado es un valor logico: para usar la probabilidad acumulativa de Poisson = 

VERDADERO; para usar la funcion de probabilidad bruta de Poisson = FALSO. 






12 







= 

13 









14 



Resultado de la formula = 0,947346983 






15 








16 



Ayuda sobre esta funcion | Aceptar | [ Cancelar | 





17 
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□ Si por el contrario, digitamos la palabra FALSO, se obtiene la probabilidad de que ocurra que 
X sea igual al parametro establecido, asi, en nuestro caso X es igual a 4. 


Figura No. 6. Argumentos de la Funcion. Parametro Falso 


H| H C H- 


Librol - Microsoft Excel 


^ Inicio | Insertar Diseno de pagina Formulas Datos Revisar Vista 

* 

3a - 
* 

Portapapeles ri 


O ° (§1 23 


Pegar 


- 11 ’ A* 

— = = (=1'' 

General 

0§| Formato condicional » 

a*“ Insertar - 

i' $r ft 


w m m rn 

^ % 000 

fc§§ Dar formato como tabla - 

1* Eliminar - 

a • 

N K S | ffi - | jfc A 

W & - 


Li+^ Estilos de celda - 

Formato - 

Ordenar Buscar y 
'•2 ’ yfiltrar * seleccionar 

Puente 

Alineacion ri 

Niimero ; j 

Estilos 

Ceidas 

Modificar 



A 

B 

C 

D 

E 

F 

G 

H 1 

J 

K 

L 

L 

1 

;2;FALSO) 












2 













3 



Ar 0 iimpntn<; Hp funrion 







4 














5 



FUibbUN.Uli 

>i 

X 

Media 

Acumulado 



LSO 






6 



1 4 

(D = 4 





7 



cl 2 

M = 2 





8 



| FALSO 

9 ■ ™ 





9 
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Devuelve la distribution de Poisson. 
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umuiauu c'j un vaiur luyicu. para u>ar la pruuaumuau acumuiauva uc rui*>un = 

VERDADERO; para usar la funcion de probabilidad bruta de Poisson = FALSO. 
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Resultado de la formula = 0,090223522 

Avuda sobre esta funcion 
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| Aceptar | [ Cancelar | 
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I 


Modificar I 


IDi ist 


APLICACIONES EN, 


I... | g) YouTube - [Rain (... 


AP 307 - Paint 


ES 9:4: 



r x -5 l“I 

P (x) - 1 - 

1 

i __! 


p _ f) Q47^ (palabra 

r (x<4) — / J VERDADERO) 


P (X=A) = 0,0902 p™ RA 


E jemplo 6. En un proceso de manufactura textil, se tiene que el promedio de defectos es de 6 por cada 
30 metros de tela. ^Cual es la probabilidad de obtener por lo menos 2 fallas o defectos, (a) en una pieza 
de 30 metros?; (b) en una pieza de 10 metros? 


a) A, = 6 por cada 30 metros de tela; x = 2, 3, 4...n 
P x>2 = 1 — l. x=0 + x—1 J 


b) X = 2 por cada 10 metros de tela; x = 2,3,4...n 


P(x>2) ~ 1 ” 


6°e~ 6 6 1 e~ 6 


0 


1 


= 1- [0,0025 + 0,014 ] 


w 1 - 


P (x>2)-L 


+f W>] 


(x=0) 


2°e“ 2 2 1 e“ 2 

-1- 


= 1-[0,1 5 +0,2 0 


P ( X >2) =1-0,0174 = 0, 26 = ,26 


Wi-o. 00 = 0 ' 5 °= 5 ' 0 


USO DE CALCULADORA 

El USO de Id calculadora nos ayuda a agilizar los calculos, veamos como se procede con alguna de ellas, 

6° -6 

por ejemplo al calcular x=0 = - , es decir, cuando X = 0 y X, = 6 


0 


Casio fx - 5000F 
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□ Se teclea 104 y luego FMLA 


□ Nos pide el valor de p? que equivale a A, procedemos a digitar el valor de 6 y luego EXE 


□ Aparece X? en nuestro caso 0 o digitamos y luego EXE y nos da el resultado de 0,0024787 
aproximadamente 0,0025. 

Casio fx -350TL y Casio fx -82TL, se procede para el calculo asi: 


( 

6 

x y 

0 

X 

SHIFT 

e x 

(-) 


0 SHIFT X! 


Casio 991 MS y 350 MS opera al igual que la calculadora anterior solo que no aparece la tecla 


x y 


sino A 


Casio 350 HB tambien se modifica el teclado x y ahorapor SHIFT x y 
Casio -360 PV opera un poco diferente a las anteriores, asi: 


( 6 x y 0 x ( 6 +/- SHIFT 


«r 

0 

SHIFT 

f 

= 


b) A = 6 por cada 30 metros; A = 2^x10 = 2 


10 


p = 1 

r (x>2) 1 


2° e~ 2 2 1 e~ 


P, 


(x>2) 


0 1 
= 1-0,4060 = 0,5 40 = 5 ,40 


= 1-[0,1353 + 0,2707] 


REPRESENTACION GRAFICA 


Tal como se hizo en la distribucion de probabilidades binomial , se puede realizar la representacion 
grafica en una distribucion probabillStica de Poisson mediante un diagrama de probabilidades parecido 
al diagrama de frecuencias. 

Utilizando la Tabla VII que aparece al final del libro o la calculadora elaboraremos las graficas para: 

X=l,l A = 2,0 y X = 6 


Figura 6.4 Diagrama de frecuencias 


% 

40 

30 

20 

10 
















1 1 1 



■. . . 




11 .. 1 


1 1 1 1 1 1 . . . 

01234567 0123456789 0123456789 10 11 12 13 14 x 

XIT0S XIT0S XIT0S 

Observese que a medida que aumenta el valor de lambda (A, la distribucion se vuelve casi simetrica. 
Ademas, el valor de n no tiene un limite especifico. 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

56. Un 10% de los utensilios producidos en un cierto proceso de fabricacion resulta ser defectuoso. 
Hallar la probabilidad que de una muestra de diez utensilios, seleccionados al azar, sean exactamente 
dos los defectuosos, mediante: 

a) distribucion binomial. b) distribucion de Poisson. 

57. Si la probabilidad de que un individuo sufra una reaccion por una inyeccion de un determinado 
suero es 0,001, determinar la probabilidad que de un total de 2.000 individuos: 

a) exactamente 3 tengan reaccion. b) mas de 2 individuos tengan reaccion. 

58. Si el 3% de las bombillas fabricadas por una compama son defectuosas, hallar la probabilidad de 
que en una muestra de 100 bombillas: 

a) 0 b) 1 c) 2 d) 3 e) 4 f) 5 sean defectuosos. 

59. El numero de ahogados en un accidente, por ano, en un pais X es de tres por cada 100.000 habitantes. 
Hallar la probabilidad de que en una ciudad cuya poblacion es de 200.000 haya: 

a) 0 b) 2 c) 6 d) 8 e) entre 4 y 8 f) menos de 3 ahogados por ano. 

60. Suponga que una empresa aerea, en promedio, uno de cada 150 vuelos se retrasan mas de una hora; 
si se programan 1.500 vuelos en un mes: 

a) ^Cual es la probabilidad de que exactamente 3 vuelos se retrasen una hora? 

b) ^Cual es la probabilidad, que mas de 3 vuelos se retarden mas de una hora? 

c) /,Cual es la probabilidad de que menos de 5 vuelos se retrasen mas de una hora? 

61. Si la probabilidad de que una persona adquiera la enfermedad como consecuencia de una vacuna 
contra la misma, es 0,0001 <^Cual es la probabilidad de que la adquieran exactamente 5 personas en 
una poblacion de 10.000 vacunados? 

62. Si la probabilidad de que un individuo sufra una reaccion por una inyeccion de un determinado 
suero es 0,001, determinar la probabilidad que de un total de 2.000 individuos: 

a) exactamente 3 tengan reaccion. b) mas de dos individuos tengan reaccion. 

(0 72) x e -0,72 

63. Una distribucion de Poisson es dada: P = -----j -Hallar la probabilidad cuando: 

a) x = 0 b) x = 1 c) x = 2 d) x = 3 

64. Entre las 2 y las 4 de la tarde, el promedio de llamadas telefonicas que recibe un conmutador de una 
empresa, por minuto, es 2,5. Hallar la probabilidad de que en un determinado minuto haya: 

a) 0 b) 1 c) 2 d) 3 llamadas. 

65. Supongamos que de cada 5.000 vehiculos, dos tienen problemas con las llantas en una autopista. Si 
1.000 vehiculos transitan por la autopista durante cierto dia, ^cual es la probabilidad de que por lo 
menos dos vehiculos tengan problemas con las llantas? 

66. Supongamos que, en promedio, una casa, de cada 2.000, en cierta zona de Buenos Aires, se incendia 
durante el ano. Si hay 6.000 casas en dicha zona, ^cual es la probabilidad de que: 
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a) mas de 3 casas se incendien durante el ano. 

b) exactamente dos se incendien durante el ano? 

67. El promedio de atracos en cierta ciudad es de dos por dia. Utilizando la distribucion de Poisson, 
determinar la probabilidad de que en un dia dado, haya: 

a) no mas de tres atracos. b) a lo mas dos atracos. 

68. Una compama de seguros considera que solamente alrededor del 0,01% de la poblacion le ocurre 
cierto tipo de accidentes cada ano. La empresa tiene 10.000 asegurados contra este tipo de accidentes, 
^Cual es la probabilidad de que maximo tres de ellos sufran accidente? 

69. Se toma una muestra de 1.500 articulos de un lote de produccion que arroja el 24% de defectuosos, 
/,Cual es la probabilidad de obtener: 

a) dos o menos articulos defectuosos. b) mas de dos defectuosos? 

70. Las estadisticas sobre la aplicacion de normas de seguridad en una fabrica indican que, en promedio, 
se presentan 10 accidentes cada semestre. Utilice la distribucion de Poisson para determinar la 
probabilidad de que no haya mas de dos accidentes de trabajo en un trimestre. 

71. El numero de demandas presentadas a una compania de seguros, en promedio (np) es de tres por 
dia. ^Cual es la probabilidad de que en un dia cualquiera: 

a) no se presente ninguna demanda. b) por lo menos se presentan dos demandas? 

72. La probabilidad de que un cajero se equivoque en el pago de un cheque es de 0,0005. ual es la 
probabilidad de que en 800 cheques pagados por dicho cajero: 

a) por lo menos se equivoque en el pago de tres cheques. 

b) maximo se equivoque en dos cheques? 

73. La tasa de mortalidad de cierta enfermedad es de tres por mil. ^Cual es la probabilidad de que en un 
grupo de 500 personas, 

a) mas de dos mueran. b) como maximo dos mueran? 

74. En promedio doce personas por hora consultan a un especialista en decoracion en un almacen de 
telas. ^Cual es la probabilidad de que durante un periodo de diez minutos, 

a) por lo menos dos se acerquen al especialista. 

b) no mas de dos se acerquen al especialista? 

75. Se estima que una de cada 10.000 personas es alergica a cierta sustancia utilizada en la fabricacion 
de tintes para el cabello, ^Cual es la probabilidad de que 30.000 usuarias de tintes, 

a) por lo menos una sufra reacciones alergicas. b) mas de una sufra reacciones alergicas? 

76. El conmutador de una clinica recibe un promedio de 20 llamadas cada 2 minutos, ^Cual es la 

probabilidad de que lleguen, 

a) exactamente 4 llamadas en un periodo de 30 segundos. 

b) como maximo dos llamadas en un periodo de 15 segundos? 

77. Los clientes llegan a una exhibicion a razon de 6,8 clientes/hora. Calcule la probabilidad de que: 
a) en la primera media hora, por lo menos llegue un cliente. 



CAPITULO SEIS 

DISTRIBUCIONES DE PROBABILIDAD 


243 


b) en el primer cuarto de hora, no llegue ningun cliente. 

c) en cualquier hora dada, llegue mas de uno 

78. Los clientes de una cafeteria llegan a razon de nueve personas, en un perfodo de 30 minutos. Calcule 
la probabilidad, 

a) de que en la primera media hora por lo menos lleguen 4 personas. 

b) de que en los 10 primeros minutos no llegue ningun cliente. 

79. El cierre de bancos por problemas financieros ha ocurrido a razon de 5,7 clausuras por ano, 

a) encuentre la probabilidad de que ningun banco sea cerrado durante un perfodo de cuatro meses, 

b) por lo menos un banco sea cerrado durante el semestre. 


DISTRIBUCION IPERGEOM TRICA 


A1 igual que la distribucion Binomidl y de Poisson, la H ipergeometrica corresponde a variables aleatorias 
discretas. 

La distribucion H ipergeometrica esta asociada, generalmente, con un proceso de muestreo sin re- 
posicion en una poblacion finita. 

Las caracterfsticas o condiciones que debe reunir una distribucion H ipergeometrica, son: 

a) La informacion de la muestra se toma sin reposicion de una poblacion finita. 

b) La probabilidad de exito no es constante, cambia para cada observacion. 

c) El resultado de una prueba es dependiente de la prueba anterior, siempre se vera afectado 
por el resultado de observaciones previas. 

d) El tamano de la muestra (n) debe ser superior en un 5% con respecto al tamano poblacional 


N. 


e) Se relaciona con situaciones que tengan que ver con dos o mas resultados 

f) La distribucion es adecuada, cuando el tamano de la poblacion es pequena. 


Esta ultima condicion limita su aplicacion. 


La formula que se debe emplear para la distribucion H ipergeometrica es: 


P 


X 



Siendo: 

N = Tamano de la poblacion 
A = Numero de exitos en la poblacion 
n = Tamano de la muestra 
x = Numero de exitos en la muestra 


Es necesario tener en cuenta que X no puede exceder a A ni a n. Recordemos que: 
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E jemplo 1. En la produccion de cierto articulo, se sabe que por cada 50 producidos, en 43 su terminado 
es excelente. Si se toma una muestra de 12 articulos, ^cual es la probabilidad: (a) de que exactamente 
dos no sean clasificados como excelentes; b) por lo menos dos no sean clasificados como excelentes; 
c) ^diez sean clasificados como excelentes? 


f 7 Y50 - 7 ^ f7 Y 43 ^ 

- Up-zJ - UAiqJ - 


a) 

P x=2 =^ 

f 50 l 




b) 

P x>2 =1- 

h )+M)1 


50 

12 


0,3317 = 33,17 


P* 2 = 1 - 


7 |f 50-7 
0 || 12-0 111 


1\(50-1 
12-1 


50 

12 


50 

12 


= 1-[0,1263+0,3317] 


p x> 2 =1-0,45 0 = 0,5420 = 54,20 


c ) P( 


^43 a 

10 


(*=io)' 


50-43 

12-10 


50 

12 


Ml 

50"| 
12 

J 


= 0,3317 = 37,17 


N = 50 
A = 7 
n =12 
= 2 


# = 50 
A =7 
n = 12 
> 2 


# = 50 
A =43 
n = 12 
= 10 


Ejemplo 2. Un colegio tiene a su disposicion para el transporte de sus estudiantes 10 buses. Por 
informacion llegada a las directivas del plantel, se sabe que 4 no se encuentran en optimas condiciones. 
Si se selecciona una muestra de 5 buses, 

a) ^Cual es la probabilidad de que dos de ellos no se encuentren en optimas condiciones? 

b) <,Que dos de ellos se encuentren en perfectas condiciones? 


o 


a ) P X =2 




0,4762 = 47,62 


jV = 10 
A = 4 
n = 5 
= 2 



0,23 1 = 23, 1 


#=10 
A = 6 
n = 5 
= 2 


En los dos ejemplos anteriores, se pueden agilizar los calculos mediante el uso de la tabla respectiva 
o la calculadora. Veamos su aplicacion en el ejemplo 2, utilizando la tabla 6.7 


























CAPITULO SEIS 

DISTRIBUCIONES DE PROBABILIDAD 


245 


Tabla 6.7 Distribucion hipergeometrica 




A 



N 

n 

(o k) 

X 

P(x) 

10 

5 

3 

0 

0,083333 

10 

5 

3 

l 

0.416667 

10 

5 

3 

2 

0.416667 

10 

5 

3 

3 

0.083333 

10 

5 

4 

0 

0.023810 

10 

5 

4 

1 

0.238095 

10 

5 

4 

2 

0.476190 

10 

5 

4 

3 

0.238095 

10 

5 

4 

4 

0.023810 

10 

5 

5 

0 

0.003968 




A 



N 


(6 k) 

X 

POO 

10 

1 

1 

0 

0,900000 

10 

1 

1 

l 

0.100000 

10 

2 

1 

0 

0.800000 

10 

2 

1 

1 

0.200000 

10 

2 

2 

0 

0.622222 

10 

2 

2 

1 

0.355556 

10 

2 

2 

2 

0.022222 

10 

3 

1 

0 

0.700000 

10 

3 

1 

1 

0.300000 

10 

3 

2 

0 

0.466667 


USO DE CALCULADORA 

En este capitulo se dan algunas indicaciones sobre el uso de aquellas calculadoras que mas se utilizan 
en clase. 


Casio fx - 5000f 

Primero se teclea el numero 
probabilidad. 


□ 

□ 


106 FMLA con lo cual aparece la formula para calcular la 


En pantalla aparece un interrogante K? que equivale a A por lo tanto tecleamos (de acuerdo al 
ultimo ejemplo y operacion), 6 y EXE 


□ 

□ 


Aparece X?, asi que tecleamos 2 EXE y observamos la pantalla 


Nos pide el valor de N? en este caso tecleamos 10 EXE 


□ Ahora, pide fl? siendo 5 y luego EXE i aparece en pantalla el mismo resultado esperado del 
ejercicio 0,238095, ver ejemplo 2b. 

De acuerdo a las marcas y model OS de las calculadoras que fueron utilizadas, tanto en la Binomial 
como en Poisson, en todas ellas se procede asi: 


( 6 nCr 2 X 4 nCr 3 ) t 10 nCr 5 


En algunas de de las calculadoras, antes de teclear el simbolo de las combinaciones se debera pro- 


ceder asi: SHIFT nCr 


Cuando las calculadoras no tienen la tecla nCr se debera proceder a teclear paso a paso, asi: 

((6 ! -r ( 4 ! x 2 ! ) x ( 4 ! - ( 3 ! x 1 ! ) ) - ( 10 ! - ( 5 ! x 5 ! x ) ) = 
Es necesario tener en cuenta con algunas calculadoras, que el uso de factorial requiere de dos teclas 
; Tambien en otras, el factorial aparece en la tecla asi X! ; equivalente a lo mismo. 


SHIFT 


Ejemplo 3. Aplicar la distribucion hipergeometrica: 
a) Dada la siguiente informacion: 
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N = 42 n = 12 


A = 36 X = 8 buenos 


b) N = 42 n = 12 


A = 42 - 36 = 6 malos X= 12 - 8= 4 malos 


^ 36 ^ 


a) P, 


6 = 8 ) ■ 


36^ 


(36 Y 

6) 

-AJ 


LU 

4 


42) 

12 


(42 

12 

V 


= 0,0410 = 4,10 


La probabilidad de obtener exactamente 8 buenos, es del 4,10% 


b ) p 3 = 4 ) 



= 0,0410 = 4,10 


La probabilidad de obtener exactamente 4 malos, es del 4,10% 

EJERCICIOS PARA RESOLVER 

La gran mayorfa de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 



80. Un profesor dispone en su archivo de 15 preguntas sobre un tema especifico de la materia; seis de 

ellas son de teorfa. Si desea preparar un cuestionario de 5 preguntas: 

a) ^Cual es la probabilidad de que 2 de las preguntas sean de teoria? 

b) ^Que dos no sean de teoria? 

81. Un Instituto Tecnico recibe un pedido de 12 computadores que requiere para dotar la division de 
sistemas. Por informacion de otro Instituto que realizo ese mismo pedido, se supo que 4 aparatos 
habian sufrido desperfectos en el transporte, situacion frecuente con la firma contratada para 
distribuir la mercancia. El director del instituto decidio examinar 3 de los computadores recibidos. 
/,Cual es la probabilidad de que ninguno de los tres resulte averiado al ser transportado? 

82. Un nuevo sabor de helado fue probado por un grupo de 15 alumnos de un colegio en el que se vende, 
10 encontraron agradable el nuevo sabor. Si quisieramos repetir la prueba, se harfa seleccionando 5 
alumnos de los 15, ^Cual es la probabilidad de que, a) a dos les guste el nuevo sabor; b) a dos no 
les guste el nuevo sabor? 

83. Un jefe de almacen sabe que 6 de las 25 bicicletas que tiene para la venta presentan fallas en los 
frenos y necesitan ajuste. Si el vendedor, que no tema conocimiento de lo anterior, vendio en el dia, 
4 bicicletas, /,Cual es la probabilidad de que vendiera dos que requerian ser ajustadas? 

84. Una Facultad de Economia cuenta con una nomina de 40 profesores, de los cuales 35 son economistas. 
Si seleccionan al azar, cinco profesores para constituir un comite, con el fin de revisar el perfil que 
debe tener el egresado, ^cual es la probabilidad de que por lo menos uno sea economista? 
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VARIABLE ALEATORIA CONTINUA 

DISTRIBUCION NORMAL 

Corresponde a una Distribucion de variable aleatoria continua , que se extiende sobre un campo de 
variabilidad infinite* y esta dada por la funcion: 


Y = 



_zY 

2<t 2 


Siendo: 


N = Numero de datos 

a = Desviacion estandar de la distribucion binomial = yjnpq 

e = Base de los logaritmos naturales = 2,71828 

n = 3,1415926535. 

p = Media de la distribucion binomial = np 


Se le suele denominar: Gaussiana, Laplaciana, Distribucion de Laplace-Gauss o de Gauss-Laplace 
o bien la segunda ley de Laplace. Aparentemente fue descubierta por De Moivre (1756) como forma 
lfmite de la Distribucion Binomial. 

Todo ejercicio planteado como Binomial , en especial cuando (n) el numero de experimentos 
realizados es grande, se debe resolver mediante la distribucion Normal. Este procedimiento permite 
facilitar y agilizar las operaciones, cuyo resultado no sera exacto (metodo binomial) sino un valor 
bastante aproximado, razon por la cual algunos lo identifican como metodo aproximado. 

Tal como se hizo en la distribucion binomial , el experimento de lanzar 12 monedas, nos permite 
elaborar una tabla de frecuencias teoricas o probabilisticas, con lo cual se obtendran las probabilidades de 

aparicion de 0 caras, 1 cara, 2 caras.12 caras, con los resultados se podra calcular la media, la varianza 

y la desviacion tipica , al igual como lo haciamos en la estadistica descriptiva , a fin de compararlo con 
los resultados obtenidos a traves de la distribucion binomial, donde: 

p = np <J 2 = npq o = yjnpq 

Los resultados del experimento son: 


Tabla 6.8 Distribucion frecuencias 


VARIABLE 

CONTINUA 

K r K 

VARIABLE 

DISCRETA 

NUMERO 

DE CARAS 

x, 

FRECUENCIA 

ESPERADA 

0 TEORICA 
”, 

PROBABILIDAD 

P(x) 

0,) 

xn 

x]n, 

-0.5 - 

0,5 

0 

1 

1/4.096 = 0.000244 

0 

0 

1 

o 

1,5 

1 

12 

12/4.0% = 0.002930 

12 

1 2 

1,5 - 

2,5 

2 

66 

66/4.096 = 0.016113 

132 

264 
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Continuacion 


2,5 - 3,5 

3 

220 

220/4.096 = 0.053711 

660 

1.980 

3,5 - 4,5 

4 

495 

495/4.096 = 0,120850 

1.980 

7.920 

4,5 - 5,5 

5 

792 

792/4.096 = 0,193359 

3.960 

19.800 

5,5 - 6,5 

6 

924 

924/4.0% = 0.225586 

5.544 

33.264 

6,5 - 7,5 

7 

792 

792/4.096 = 0,193359 

5.544 

38.808 

1 

00 

l/i 

8 

495 

495/4.096 = 0,120850 

3.960 

31.680 

8,5 - 9,5 

9 

220 

220/4.096 = 0,053711 

1.980 

17.820 

9,5 - 10,5 

10 

66 

66/4.096 = 0,016113 

660 

6.600 

10,5 - 11,5 

11 

12 

12/4.096 = 0,002930 

132 

1.452 

11,5 - 12,5 

12 

1 

1/4.096 = 0.000244 

12 

144 


Z 

4.096 

1.000 = 1,000000 

24.576 

159.744 


X = 


1 X,n, 


N 


v 24.576 , 

x= ToT = 6 


1 * A^ 1 

i__ i 


o2 _ X^ n i TF2 

S ~ N X 


c 2 _ 15 .744 

s -irr*- 3 


-36 = 3 


[-2 _ X^f/, ^ 

Id - x 

I_I 


Teorema. Si p es la probabilidad de exito de un suceso en un solo experimento 
y Q es la probabilidad de fracaso, entonces la distribucion binomial que da las 
frecuencias esperadas para 0, exitos en fl experimentos, tiene como media 

y desviacion tipica 


Se tiene: 
forma: 


= np 



, formulas que aplicaremos al ejercicio anterior, en la siguiente 


= np 
g~= npq 
o = Vnpq 


= 12 ( 1 / 2 ) = 6 
G 2 = 12 (1/2) (1/2) = 3 
O = V12 (1 / 2) (1 / 2) = v'3 = 1,732 


Representation grafica 

Con los datos de la Tabla 6.8 correspondiente a las frecuencias teoricas, elaboramos un histograma de 
frecuencias. Teniendo en cuenta que el numero de aparicion de caras corresponde a una variable discreta 
y al no haber establecido intervalos, se debera colocar cada valor de la variable en el centro del rectangulo. 

Uniendo los puntos medios en la parte superior de cada rectangulo, obtenemos una curva, conocida como 
ya se dijo con los nombres de curva normal , curva de G auss, curva de error o curva de probabilidad. 

El histograma binomial es Sl'metrico, cuando p = Q = V2. Tal como se presenta en el lanzamiento de una 
moneda; pero en el lanzamiento de un dado, por lo general, es diferente: P ^ Q. 

Se debe recordar que la variable en una distribucion binomial es discreta y se debe transformar en una 
variable Continua, cuando se quiere utilizar la distribucion normal ; dado que la amplitud del intervalo 
siempre va a ser uno (C = 1), se divide entre dos (C/2), siendo igual a 0,5. Ahora, al restarlo establecemos 
el limite inferior y al sumarlo se obtiene el limite superior de cada intervalo, asi elaboramos la primera 
columna que aparece en la Tabla 6.8. 
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Con la Variable continua , es decir, la variable corresponde a intervalos, con ellos elaboramos el 
histograma y el poligono de frecuencias. Es necesario observar algunas condiciones que debe reunir la 
curva normal o probabilistica. 



Condiciones que debe reunir la curva normal o probabilistica 


■ La curva es simetrica. 


■ El area bajo la curva es igual al 100%. 

■ La curva no toca el eje horizontal ( X ) ya que es asintotica, se prolonga indefinidamente. 

■ La media p se localiza en el centro de la curva, es decir, cada parte es igual al 50% 

■ X toma valores de menor a mayor, es decir, de izquierda a derecha. 


■ Al estandarizar, convertir los valores de X en valores de Z, esta tendra una media 
z = 0y o - 1 y Z tomara valores desde -3 hasta +3 que cubre un area en el 
99,7%, casi igual al 100%. 


■ La variante estadistica Z = 


X-p 


es una medida de las desviaciones estandar 


o 

o de las llamadas unidades estandarizadas, conocida como desviacion normal. 


■ Al usar la tabla 6.9 correspondiente a Areas bajo la curva normal, esta tomara a 
valores del centro a la derecha y del centro hacia la izquierda, dado que la tabla solo 
presenta la mitad de la curva, asi que el area de Z = 0 hasta Z = 2, sera la misma de 
Z = 0 hasta Z = -2. Hay tablas donde el valor del area se presenta acumulada. 


Ejemplo 1. En el lanzamiento de 12 monedas ^Cual es la probabilidad de obtener: a) exactamente 4 
caras; b) por lo menos 2 caras; c) como maximo 9 caras? 

























250 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


u 

a) p = 0,5 q = 0,5 n = 12 

Binomial: P (x=4) = j (0,5) 4 (0,5) 8 = 0,1208 = 12,08% (Resultadoexacto) 
Normal: = 12 (0,5) = 6 O = V 12 (0,5)(0,5) =1,73 


Con la media y desviacion tipica en una distribucion binomial, X es la variable discreta, (X - 4) se 
transforma en continua, sumando y restando 0,5 al valor de 4, siendo P (35<x<45) (no hay problema si se 
omite el igual). 



En este caso restamos: 


A (0,4265) - A (0,3079) = 0,1186 

P (3 5< x <4 5 )= 11,86 % (resultado aproximado) 

(Ver tabla 6.1 Areas bajo la curva normal ) 


b) Por lo menos dos caras X=2,3, 4, 5, 6.12 

P(r>o\ — 1 - \Pi y = ni + Piv -nl (binomial) 


(x>2) ^ [P(x=0) P(x=l)] 

12 


P = 1 - 

(X>2) 


\0 


(0,5)° (0,5) 12 + 


(12 


(0,5)' (0,5)‘ 


= 99,69% (resultado exacto) 


Normal: =6 y (7=1,73 P 


(x >1,5) 


(restamos 0,5 a X = 2) 


Z =i^ = -2,60 => A( 0,4 53) (ver tabla) 

En este caso sumamos las dos areas: 

A(0,4953) + A(0,5000) = 0,9953 = 99,53% 

P j 5 = 99,53% (resultado aproximado) 
c) Como maximo 9 caras X=0, 1, 2, 3, ....9 

P (x< 9 ) = 1 “ [P ( 10) + P <11) + P (12)1 = 98,08% (Binomial) 

Normal: =6 cr=l,73 

Ir_ z: 

Z =—-= 2,02 => A 0,47 3 ver tabla P =91 83% 

1 73 ' (x < 9,5) ' 

Se suman las dos areas: 0,5000 + 0,4783 = 0,9783 = 97,83% 


0,5000 




Ahora procedemos a desarrollar un ejercicio, cuando el valor de /i y cr ya estan calculados, en 
este caso x queda exactamente igual como lo da el problema (como variable continua), en este caso se 
omite: restar y/o sumar 0,5 
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Para el manejo y calculo de areas, se le recomienda al lector, obligatoriamente hacer los ejercicios 
numerados desde el 83 hasta el 92 y asi podra saber cuando se suma y/o se resta. 

E jemplo 2. Un profesor manifiesta que el promedio que los estudiantes obtienen en su asignatura es de 
3,9, con una desviacion tipica 0,35. ^Cual es la probabilidad que uno de sus alumnos obtenga: 

a) una calificacion superior a 4,4. 

b) inferior a 3,2. 

c) que gane la asignatura (mayor o igual a 3)? 


o 


a) — 3, o —0,35 ^*>4,4) 

z= x-ji 

<7 

Z = 4 q 35’ =1 ’ 43 => ^4(0,4263) 
0,5000-0,4263 = 0,0737 = 7,37 

P( X > 4,4) = 


0,5000 



X 

z 


0,5000 - 0,4773 = 0,0227 = 2,27 

P(x<3,2) = ^’27 


0,5000 



0,5000 



Cada cantidad de la tabla correspondera a la propor- 
cion bajo la curva que se encuentre entre Z = 0 y un 
valor positivo de Z. Las areas para valores negativos 
de Z se obtienen por simetria. 
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Tabla 6.9 Areas de una distribucion normal ordinaria 



0,00 

0,01 

0,02 

0,03 

0,04 

0,05 

0,06 

0,07 

0,08 

0,0 

0,0 

0,0000 

0,0040 

0,0080 

0,0120 

0,0160 

0,01 

0,023 

0,027 

0,031 

0,035 

0,1 

0,03 8 

0,0438 

0,0478 

0,0517 

0,0557 

0,05 6 

0,0636 

0,0675 

0,0714 

0,0754 

0,2 

0,07 3 

0,0832 

0,0871 

0,0 10 

0,0 48 

0,0 87 

0,1026 

0,1064 

0,1103 

0,1141 

0,3 

0,117 

0,1217 

0,1255 

0,12 3 

0,1331 

0,1368 

0,1406 

0,1443 

0,1480 

0,1517 

0,4 

0,1554 

0,15 1 

0,1628 

0,1664 

0,1700 

0,1736 

0,1772 

0,1808 

0,1844 

0,187 

0,5 

0,1 15 

0,1 50 

0,1 85 

0,201 

0,2054 

0,2088 

0,2123 

0,2157 

0,21 0 

0,2224 

0,6 

0,2258 

0,22 1 

0,2324 

0,2357 

0,238 

0,2422 

0,2454 

0,2486 

0,2518 

0,254 

0,7 

0,2580 

0,2612 

0,2642 

0,2673 

0,2704 

0,2734 

0,2764 

0,27 4 

0,2823 

0,2852 

0,8 

0,2881 

0,2 10 

0,2 3 

0,2 67 

0,2 6 

0,3023 

0,3051 

0,307 

0,3106 

0,3133 

0 , 

0,315 

0,3186 

0,3212 

0,3238 

0,3264 

0,328 

0,3315 

0,3340 

0,3365 

0,338 

1,0 

0,3413 

0,3438 

0,3461 

0,3485 

0,3508 

0,3531 

0,3554 

0,3577 

0,35 

0,3621 

u 

0,3643 

0,3665 

0,3686 

0,3708 

0,372 

0,374 

0,3770 

0,37 0 

0,3810 

0,3830 

1,2 

0,384 

0,386 

0,3888 

0,3 07 

0,3 25 

0,3 44 

0,3 62 

0,3 80 

0,3 7 

0,4015 

1,3 

0,4032 

0,404 

0,4066 

0,4082 

0,40 

0,4115 

0,4131 

0,4147 

0,4162 

0,4177 

1,4 

0,41 2 

0,4207 

0,4222 

0,4236 

0,4251 

0,4265 

0,427 

0,42 2 

0,4306 

0,431 

1,5 

0,4332 

0,4345 

0,4357 

0,4370 

0,4382 

0,43 4 

0,4406 

0,4418 

0,4430 

0,4441 

1,6 

0,4452 

0,4463 

0,4474 

0,4485 

0,44 5 

0,4505 

0,4515 

0,4525 

0,4535 

0,4545 

1,7 

0,4554 

0,4564 

0,4573 

0,4582 

0,45 1 

0,45 

0,4608 

0,4616 

0,4625 

0,4633 

1,8 

0,4641 

0,464 

0,4656 

0,4664 

0,4671 

0,4678 

0,4686 

0,46 3 

0,4700 

0,4706 

1 , 

0,4713 

0,471 

0,4726 

0,4732 

0,4738 

0,4744 

0,4750 

0,4756 

0,4762 

0,4767 

2,0 

0,4773 

0,4778 

0,4783 

0,4788 

0,47 3 

0,47 8 

0,4803 

0,4808 

0,4812 

0,4817 

2,1 

0,4821 

0,4826 

0,4830 

0,4834 

0,4838 

0,4842 

0,4846 

0,4850 

0,4854 

0,4857 

2,2 

0,4861 

0,4865 

0,4868 

0,4871 

0,4875 

0,4878 

0,4881 

0,4884 

0,4887 

0,48 0 

2,3 

0,48 3 

0,48 6 

0,48 8 

0,4 01 

0,4 04 

0,4 06 

0,4 0 

0,4 11 

0,4 13 

0,4 16 

2,4 

0,4 18 

0,4 20 

0,4 22 

0,4 25 

0,4 27 

0,4 2 

0,4 31 

0,4 32 

0,4 34 

0,4 36 

2,5 

0,4 38 

0,4 40 

0,4 41 

0,4 43 

0,4 45 

0,4 46 

0,4 48 

0,4 4 

0,4 51 

0,4 52 

2,6 

0,4 53 

0,4 55 

0,4 56 

0,4 57 

0,4 5 

0,4 60 

0,4 61 

0,4 62 

0,4 63 

0,4 64 

2,7 

0,4 65 

0,4 66 

0,4 67 

0,4 68 

0,4 6 

0,4 70 

0,4 71 

0,4 72 

0,4 73 

0,4 74 

2,8 

0,4 74 

0,4 75 

0,4 76 

0,4 77 

0,4 77 

0,4 78 

0,4 7 

0,4 80 

0,4 80 

0,4 81 

2, 

0,4 81 

0,4 82 

0,4 83 

0,4 83 

0,4 84 

0,4 84 

0,4 85 

0,4 85 

0,4 86 

0,4 86 

3,0 

0,4 87 

0,4 87 

0,4 87 

0,4 88 

0,4 88 

0,4 8 

0,4 8 

0,4 8 

0,4 0 

0,4 0 


Tabla 6.9 Areas bajo la curva normal 



En el primer caso: (a) el area comienza a crecer, desde el centro (donde Z=0) hacia la derecha 
(tambien hacia la izquierda por ser simetrica). En el segundo (b) crece de izquierda a derecha y 
hasta Z=0 el area corresponded a la mi tad de la curva siendo igual al 50%. Luego se prolonga 
hasta Z=3 donde el valor total del area sera de 0,9987. En (c) el area correspondiente a la parte 
sombreada, su valor disminuye, como consecuencia de la diferencia entre el valor de la mitad de la 
curva (50%) y el area de columna, para obtener el valor de la zona sombreada. 
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Ejemplo 3. 

A. Cuando solamente se requiera calcular el valor correspondiente a Z, se procedera de la 
siguiente forma: 

□ Nos ubicamos en la funcion fx, haciendo CLIC en ella y seleccionamos NORMALIZACION 
tal como se presenta en la siguiente figura: 


Figura No.7. Insertar Funcion 


(S| H - O' - | - 


Librol - Microsoft Excel 


□ lfP S3 



Digitamos el valor correspondiente X siendo en nuestro caso igual a 64.8. De la misma forma, 
en la siguiente casilla identificada como MEDIA, digitamos el valor correspondiente a 62.3 y 
finalmente en la casilla DESV_ ESTANDAR digitamos el valor de 2,4 

A1 presionar ACEPTAR, observamos que el resultado de Z corresponde a 1.0416666667 con 
todos los decimales, este resultado serfa exactamente igual al resultado que obtendrfamos al 
utilizar las tablas que aparecen en el libro para el calculo de Z 


Figura No. 8. Argumentos de la Funcion 


®i ia -o - c* -1 - 


Inicio | Insertar Diseno de pagina 


Librol - Microsoft Excel 

Formulas Datos Revisar Vista 


3 [op S3 


* 

Ra - 


hi at s | m 


-li 

A* - 


a* - " — = m 

General 

- [ffi| Formato condicional * 

Insertar - 

T. 

I 5 5 g 

m % 

000 j 8® Dar formato comotabla - 

3* Eliminar * 


^ -ifc -§fc i ^ - 

A.S -°8 

1 Ug Estilos de celda - 

Ijjtii Formato - 

<2- 

r. | Alineacion n, 

Numero 

Estilos 

Cel das 





Ordenar 
y filtrar * s< 
Modifici 


NORMALIZACION - X V [jfc | =NORMALIZACION(64,8;62,3;2,4) 



A 

B 

C | D 1 E | F | G j H 1 1 J 

K 

L 


l 

;62,3;2,4) 






2 







3 




Argumentos de funcion ? E3 





4 









5 




MOP MALIZACION 





6 




x 164,8 [Big] = 64,8 





7 




Media |62,3 [Be] = 62,3 





8 




Desv_estandar 12,4| [Bs] = 2,4 





io 




= 1,041666667 

Devuelve un valor normalizado de una distribucion caracterizada por una media y desviacion estandar. 

Desv_estandar es la desviacion estandar de la distribucion, un numero positivo. 
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Resultado de la Formula = 1,041666667 
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Avuda sobre esta funcion [ Aceptar | | Cancelar | 
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B. 


Si por el contrario nuestro objetivo es calcular el AREA BAJO LA CURVA NORMAL, 
utilizamos la funcion correspondiente a DIST.NORM. E STAND. 


P(X<64,8) = P(Z< 1,04) = 0,8508 = 85,08% 


Figura No.9. Insertar Funcion 
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Escriba una breve description de lo que desea hacer y, a 1 Ir 
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continuation, haga die en Ir 
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O seleccionar una categoria: Estadisticas | v | 
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sleccionar una funcion: 
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DISTR. NORM. W 
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DISTR.NORM.ESTAND.N(z;acumulado) 
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Devuelve la distribution normal estandar (tiene una media de cero y una desviacion 
estandar de uno). 
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Observemos el cuadro siguiente donde aparece la casilla correspondiente al valor que tomara Z 
y un valor logico que para nuestro caso lo consideraremos VERDADERO. 

□ Al digitar el valor de 1.04 aparece como resultado de esta operacion el valor de 0.85083005, 
correspondiente al acumulado, es decir P(Z<1.04). 


Figura No. 10. Argumentos de la Funcion 


S| A *) --k 


Librol - Microsoft Excel 



C. La forma de DIST.NORM, nos permite agilizar las operaciones realizadas cuando utilizamos el 

procedimiento B, para hallar el area bajo la curva normal, asi: 

□ Nos ubicamos en fx, y hacemos CLIC en DIST.NORM. 

□ En la figura correspondiente a DIST.NORM digitamos los siguientes datos: La X correspondiente 
al valor de la variable sera de 64.8; la MEDIA en nuestro ejercicio es de (p = 62,3); y la DESV_ 
ESTANDAR (G = 2,4). 

□ Una vez digitados los anteriores datos, se tienen dos (2) alternativas: VERDADERO 
correspondiente al valor logico, nos dara como resultado el valor de 0.851216854 (85.12%) 
correspondiente a la funcion distributiva acumulativa P (X<648) = 85,12%. Si por el contrario, 
utilizamos la palabra FALSO nos dara como resultado 0,09662266 (9,66%), correspondiente a 
la funcion de probabilidad bruta. 

□ Los dos casos anteriores pueden ser observados en los 2 cuadros que aparecen a continuacion: 


■ En la SEGUNDA PARTE DEL SIL queacompa a al libro, encontrara en conjuntotoda la aplicacion del 
EXCEL a la ESTADISTICA, queigual al capitulo 13, ofreceuna BASE DE DATOS para trabajar. 
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Figura No. 11. Argumentos de la Funcion. Parametro Verdadero 
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Figura No. 12. Argumentos de la Funcion. Parametro Falso (pantallazo adicional) 
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D. Otro procedimiento que podemos realizar, conociendo la probabilidad correspondiente al 
area bajo la curva normal, ademas delaMEDlAyDESVIACIONTIPICA, cor responde IN V. 
NORM Veamosla: 

□ Hacemos CLIC en funcion fx seleccionando INV. NORM. 

□ En el renglon PROBABILIDAD digitamos el resultado obtenido con la explicacion del 
procedimiento C, correspondiente al valor de 0.85126854. 

□ En el segundo renglon digitamos el valor de la MEDIA, siendo igual a 62.3. 

□ Finalmente en el tercer renglon digitamos el valor correspondiente a la DESV_ ESTANDAR 
de 2.4. 


Figura No. 13. Argumentos de la Funcion 
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Nota: Para mayor comprension, ver ejemplo 3. Con aplicaciones de Excel completo en el 
archivo Capitulo 6 ejemplo 3 en el SIL en internet. 


EJERCICIOS PARA RESOLVER 

La gran mayorfa de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en L inea SI L. 

85. Hallar el area bajo curva normal: 

a) Z = - 1,20 y Z = 2,40 b)Z=l,23 y Z=l,87; c) Z =-2,35 y Z = -0,50 
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86. Determinar el area bajo la curva normal 

a) a la izquierda de Z = -1,78 b) a la izquierda de Z = 0,56 

c) a la derecha de Z = -1,45 d) correspondiente a Z < 2,16 

e) correspondiente a - 0,80 < Z < 1,53 


87. Encontrar el valor de Z: 

a) el area a la derecha de Z es igual a 0,2266 b) el area a la izquierda de Z es 0,0314 

c) el area entre - 0,23 y Z es igual a 0,5722 d) el area entre 1,15 y Z es 0,0730 


88. Hallar Z si el area bajo la curva normal: 

a) entre 0 y Z es 0,4515 b) a la derecha de Z es 0,3121 c) a la derecha de Z es 0,8023 

d) a la izquierda de Z es 0,4562 e) entre - Z y Z es 0,7436 


89. Hallar el area bajo la curva normal: 

a) a la derecha de Z = 2,68 b) a la izquierda de Z = 1,73 c) a la derecha de Z = - 0,66 

d) a la izquierda de Z = -1,88 e) entre Z = 1,25 y Z = 1,67 f) entre Z = 0,90 y Z = - 1,85 

g) entre Z = -1,45 y Z = 1,45 h) entre Z = 0,90 y Z = 1,58 


90. Si la media y la desviacion estandar de una distribucion normal: = 35,7 y G - 2,8 cmts. Obtener 
los valores de Z (redondear en dos decimales las respuestas): 

a) X- 38,7 cmts. b) X- 31,5 cmts. c) X- 53,9 cmts. d)X= 29,6 cmts. 


91. Una variable aleatoria Z tiene distribucion normal reducida (media 0 y varianza 1). Determinar las 
probabilidades utilizando la tabla de areas bajo la curva: 


a) P 


(z<0) 


b) P 


(1< z < 3) 


C) P 


(z > 3 


^(z = -l) 


e)P 


(2< z < - 2 ) 


92. Si X se encuentra distribuida normalmente con media 10 y desviacion estandar 2, emplear la tabla 
de areas para calcular la probabilidad de: 

a)X< 12 b)X> 11 c)X>9 d)X>9,5 e)9<X<12 


93. Suponiendo que las estaturas (X) de varones de un colegio se encuentran distribuidas normalmente 
con media igual a 169 cm. y desviacion estandar igual a 3 cm. (Emplear la tabla de areas bajo la 
curva para calcular la probabilidad). 

a) ^Cual es la probabilidad de que un estudiante tenga una estatura inferior a 165 cm? 

b) ^Que porcentaje de alumnos tendra una estatura entre 1,65 y 1,70? 

94. En una distribucion binomial de frecuencias, donde p = 14, encuentre la probabilidad de obtener 25 
o mas exitos en 80 experimentos. 

95. Un fabricante de bombillas electricas ha encontrado que, en promedio, un 2% son defectuosas. 
^Cual es la probabilidad que en 1.000 bombillas seleccionadas al azar, se encuentren 15 o mas 
defectuosas? 


96. Use la curva normal para encontrar la probabilidad de obtener exactamente 16 veces el seis en 
96 lanzamientos de un dado; compare el resultado con el valor 0,110 obtenido con la distribucion 
binomial. 

97. Dada una curva normal con p = 25,3 y o = 8,1. Hallar el area bajo la curva normal entre 20,6 y 
29,1 
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98. Dada la curva normal con jlx = 17,2 y a = 3,5. Hallar: a) el area bajo la curva normal a la derecha 
de 20, b) el area a la izquierda de 19,4 y c) el area entre 9,3 y 11,7 

99. El peso medio de las frutas de un gran cargamento es de 15,00 onzas, con una desviacion estandar 
de 1,62 onzas; si sus pesos estan distribuidos normalmente, ^que porcentaje de frutas tendra un peso 
entre 15,00 y 18,00 onzas? 

100. Si la vida media de cierta marca de baterias es de 30 meses, con una desviacion estandar de 6 meses, 
^que porcentaje de estas baterias puede esperarse que tengan una duracion de 24 a 36 meses? Se 
supone que su duracion sigue una distribucion normal. 

101. Se sabe que la duracion media de los tubos de los receptores de television es de 3,0 anos, con una 
desviacion estandar de 1,5 anos. Los tubos que duran menos de un ano se reemplazan sin costo. 
Por cada 100 receptores vendidos (un tubo por receptor), ^cuantos tubos deberan reemplazarse 
gratis? 

102. En cierto negocio de construccion el salario medio mensual es de $686,000 y la desviacion estandar 
de $4,500. Si se supone que los salarios tienen una distribucion normal, ^que porcentaje de obreros 
perciben salarios entre $680,000 y $685,000. 

103. Si una distribucion normal de variable continua tiene p = 21,2 y a = 3,1 , encuentre la probabilidad 
de que una variable, seleccionada al azar, sea mayor de 30 o menor de 15. 

104. La lluvia estacional media en cierto pueblo es de 18,75 pulgadas, con una desviacion estandar de 
6,50 pulgadas. Se supone que la lluvia estacional tiene una distribucion normal. ^En cuantos anos, 
de un periodo de 50, se podra esperar una lluvia de 15,00 a 25,00 pulgadas? 

105. Dos estudiantes fueron informados de que habian recibido referencias tipificadas de 0,8 y - 0,4, 
respectivamente, en un examen de ingles. Si sus puntuaciones fueron 88 y 64, respectivamente, 
hallar la media y desviacion tipica de las puntuaciones del examen. 

106. La media del peso de 500 estudiantes en un cierto colegio es de 151 libras y la desviacion tipica de 
15 libras. Suponiendo que los pesos se distribuyen normalmente, hallar el numero de estudiantes 
que pesan: a) entre 120 y 155 libras; b) mas de 185 libras. 

107. Las puntuaciones de un ejercicio de biologia 0, 1, 2, ... dependiendo del numero de respuestas 
correctas a 10 preguntas formuladas. La puntuacion media fue de 6,7 y la desviacion tipica de 
1,2. Suponiendo que las puntuaciones se distribuyen normalmente, determinar: a) el porcentaje 
de estudiantes que obtuvo 6 puntos; b) la puntuacion maxima del 10% mas bajo de la clase; c) la 
puntuacion minima del 10% superior de la clase. 

108. La puntuacion media en un examen final fue de 72 y la desviacion tipica de 9. El 10% de los 
mejores alumnos recibio la calificacion A. ^Cual es la puntuacion minima que un estudiante debio 
tener para recibir una A? 

109. Si las estaturas de 10.000 alumnos universitarios tienen una distribucion normal, con media de 169 
centimetros y desviacion estandar de 2,5 centimetros. 

a) ^Cuantos alumnos tendran por lo menos 172 centimetros? 

b) ^Cual es el intervalo que incluye al 75% central de alumnos? 
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110. Tres estudiantes presentan varios examenes. A, obtiene un puntaje de 72; B, de 85 y C, de 17. Todos 
los estudiantes que presentaron el examen A, obtuvieron un promedio de 85, los que presentaron B, 
de 90 y los de C, promediaron 25. Las respectivas desviaciones estandar fueron 7,3 y 7. Disponga 
a los estudiantes en orden de capacidad, juzgada por estos resultados. 

111. A1 calibrar ciruelas cocotas, cuyos pesos estan distribuidos normalmente, un 20% es pequeno; 55% 
mediano; 15% grande y 10% extra grande. Si el peso medio de las ciruelas es de 4,83 onzas, con 
una desviacion estandar de 1,20 onzas. /,Cuales son los limites superior e inferior del peso de las 
ciruelas medianas? 

112. Un conjunto de 10.000 observaciones tiene una distribution normal con media de 450. Si 1.700 de 
ellas estan comprendidas entre 450 y 460, ^cual es la desviacion estandar? 

113. En una distribution normal que tiene una desviacion estandar de 2,00, la probabilidad de que el 
valor de una variable, elegida al azar, sea mayor de 28, es 0,03. 

a) Calcule la media de la distribution. 

b) Obtenga el valor de la variable que supera el 95% de los valores. 

114. En un examen la nota media fue de 70,0 y la desviacion estandar 10,0. El profesor da a todos los 
estudiantes con notas de 61,0 a 79,0 la calificacion C. Hubo 24 alumnos con C. Si se supone que las 
calificaciones siguen una distribution normal, ^cuantos alumnos se examinaron? 

115. En una distribution normal con media 15,00 y desviacion estandar 3,50, se sabe que 647 
observaciones son may ores a 16,25. ^Cual es el numero total de observaciones? 

116. Un profesor califica un 10% de los examenes con A; 20% con B; 40% con C; 20% con D y 10% con 
E. Se obtiene 68,0 como promedio en un examen. Si el limite entre C y B es de 78,0 en ese examen 
y si las calificaciones estan normalmente distribuidas, ^cual es la desviacion estandar del curso? 

117. La estatura de un numero de estudiantes esta distribuida normalmente con una media de 168,50 
centimetros. Si un 12% mide por lo menos 171,20 centimetros. /,Cual es la desviacion de esta 
distribution? 

118. En una distribution normal con media de 100 y desviacion estandar de 53, existen 135 observaciones 
may ores de 200. ^Cuantas observaciones hay entre 150 y 200? 

119. En una distribution normal, con media 72,0 y desviacion estandar 12,0, existen 220 observaciones 
entre 42,0 y 90,0. ^Cuantas observaciones comprende toda la distribution? 

120. En una distribution normal con media de 120 y desviacion estandar de 30,0 existen 300 observaciones 
entre 130 y 150. ^Cuantas observaciones existen entre 130 y 145? 

121. En un examen, 13% del curso obtuvo una calificacion de A; 20% de B; 48% de C; 10% de D, y 9% 
de E. La calificacion C incluye desde 55 a 79 puntos. En el supuesto de una distribution normal, 
^cual es la media y la desviacion estandar de las calificaciones? 

122. Si la distribution de los perfodos de duration de cajas telefonicas metalicas es tal que el 9,51% 
excede los 15 anos y el 62,55% los 9 anos, ^cual es la media y la desviacion estandar, si se admite 
que la distribution es normal? 
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123. En promedio, el 10% de las varillas de madera usadas en cierto producto son demasiado nudosas 
para usarlas. ^Cual es la probabilidad de que en un paquete de 15 varillas: a) exactamente 5 sean 
demasiado nudosas; b) por lo menos 10 esten demasiado nudosas; c) no mas de 4 esten demasiado 
nudosas? 

124. Como regia, 25% de los productos manufacturados por un cierto torno, son defectuosos, ^cual es la 
probabilidad de que en 20 de estos productos haya: a) exactamente 15 defectuosos; b) menos de 6 
defectuosos; c) por lo menos 8 defectuosos? 

125. En promedio, el 20% de las varillas de madera usadas en cierto producto son demasiado nudosas. ^Cual 
es la probabilidad de que en un paquete de 200 varillas, exactamente 5 esten demasiado nudosas? 

126. Como regia el 15% de ciertos productos manufacturados por un torno, son defectuosos. ^Cual es la 
probabilidad de que en 1.000 de estos productos haya 100 defectuosos? 

127. El 10% de ciertas unidades compradas por un almacen son inadecuadas para la venta. ^Cual es la 
probabilidad de que: 

a) 42 o menos resulten inadecuadas en un lote de 500; 

b) menos de 18 sean inadecuadas en un lote de 300? 

128. A1 inspeccionar 2.330 soldaduras producidas por cierto tipo de maquina se encontraron 448 uniones 
defectuosas. A1 revisar 5 soldaduras, ^cual es la probabilidad de encontrar 3 6 mas defectuosas? 

129. La probabilidad de que un alumno que entra al primer semestre se gradue, es de 0,4. Encuentre la 
probabilidad de que de 5 amigos que entran al primer semestre: 

a) solamente uno se gradue; b) ninguno se gradue. 

130. Si en general el 25% de los pacientes afectados por una enfermedad mueren de ella, ^Cual es la 
probabilidad de que, en un grupo de 50, mueran 6? 

131. Una caja contiene 1.280 bombillas. El 15% de ellas son defectuosas; ^cual es la probabilidad de que 
una muestra al azar de 120 bombillas contenga menos de 5 defectuosas? 

132. La tasa de mortalidad para cierta enfermedad es 18 por 1.000. ^Cual es la probabilidad de que 5 
mueran de esta enfermedad, en un grupo de 500? 

133. Si la distribucion de X es normal, con media pi y o = 0,4; hallar: a) P (x>0) b) P (02<x< x 8) 

134. Pruebas realizadas en bombillas electricas de cierta marca, indican que el periodo de duracion se 
distribuye normalmente con media igual a 1.860 horas y desviacion estandar igual a 68 horas. Estimar 
el porcentaje de bombillas con una duracion de: 

a) mas de 2.000 horas; b) menos de 1.750 horas. 

135. El tiempo empleado para ir de un hotel al aeropuerto por la ruta A se distribuye normalmente, 
con media igual a 27 minutos y desviacion tipica igual a 5 minutos; por la ruta B la distribucion 
es normal con media igual a 30 y desviacion tipica igual a 2. ^Que ruta conviene utilizar si se 
dispone de: 

a) 30 minutos; b) 34 minutos? 
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136. Se sabe que la duration de las conversaciones telefonicas en una oficina tiene una distribution 
normal, cuya media es 4 y desviacion estandar de 2 minutos, ^Cual es la probabilidad de que una 
conversacion dure mas de cinco minutos? 

137. Los ingresos en cierto sector economico se distribuyen normalmente. La clasificacion de los grupos 
economicos de mayor a menor ingreso son los siguientes: 


GRUPO 

% DE INDIVIDUOS 

EN EL GRUPO 

A 

10 

B 

19 

C 

40 

D 

20 

E 

11 


Si el ingreso del grupo C esta comprendido entre $ 750.000 y $ 780.000 mensuales, calcule la media 
y la desviacion estandar de los ingresos mensuales del sector. 

138. Encontrar la probabilidad de que las 5 primeras personas que se encuentren cierto dia, por lo menos 
3 hay an nacido en domingo: 

a) mediante el metodo exacto (binomial). 

b) mediante el metodo aproximado (normal). 

c) mediante la distribucion de Poisson. 

139. ^Cual es la probabilidad de que 36 personas de una poblacion de 360, de las cuales 252 son 
fumadoras, sean todas fumadoras? 

140. En una distribucion normal que tiene una desviacion estandar de 2, la probabilidad de que el valor 
de una variable al azar sea mayor de 30 es de 0,05. a) Calcule la media de la distribution; 

b) Obtenga el valor de la variable que es superado por el 95% de los valores. 

141. Un industrial sabe que, en promedio, un 8% de sus productos es defectuoso. ^Cual es la probabilidad 
de que un lote de 100 piezas tenga por lo menos 15 defectuosas? 

142. Un conjunto de 10.000 observaciones tiene una distribucion normal con media 450. Si 1.900 
de ellas estan comprendidas entre 440 y 460, a) ^cual es la desviacion estandar?; b) ^cuantas 
observaciones hay entre 460 y 470? 

143. Un par de dados perfectos se lanzan 50 veces. ^Cual es la probabilidad de que la suma de sus caras 
de un valor de 6, de 7 o de 8, aparezcan 25 veces o mas? 

144. Una fabrica de aluminio produce, entre otras cosas, cierto tipo de canal de una aleacion de aluminio. 
Por experiencia se sabe que la rapidez, medida en psi efectivos, esta normalmente distribuido, 
con media 2.425 psi y desviacion estandar de 115 psi. ^Cual es la probabilidad de que la canal 
seleccionada tenga un valor superior a 2.500 y menos de 2.250 psi? 

145. Al hacer girar (impulsar) la flecha de una ruleta, su punta indicadora tiene la misma probabilidad 
de detenerse en cada uno de los cuatro cuadrantes. Si la flecha se hace girar 18 veces, ^cual es la 
probabilidad de que su punta se detenga menos de 3 veces en el primer cuadrante? 
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146. En una distribucion con media 15 y desviacion estandar 3,5, se sabe que 647 observaciones son 
may ores que 16,30. ^Cual es el numero total de observaciones? 

147. El gerente de credito de un almacen de articulos electrodomesticos estima las perdidas por malos 
clientes durante el ano, en la siguiente forma: la perdida tiene distribucion normal con media de 
$50,000; ademas, la probabilidad de que sea mayor de $60,000 y menor de $40,000 es de 0,40, 
^cual es la desviacion estandar? 

148. La vida util de las pilas de cierta marca estan distribuidas normalmente. Si el 7,68% de las pilas 
duran mas de 54 horas y 39,80% duran menos de 50 horas, ^cual es la media y la desviacion 
estandar? 

149. La taberna Sancho ha instalado una maquina automatica para la venta de sifon. La maquina puede 
regularse de modo que la cantidad media de sifon sea la que se desee; sin embargo, en cualquier 
caso esta cantidad tendra una distribucion normal, con una desviacion estandar de 5,9 cm 3 . 

a) Si el nivel se ajusta 304,6 cm 3 , ^que porcentaje de los vasos contendran menos de 295,7 cm 3 ? 

b) i A que nivel medio debe ajustarse la maquina para que solo el 2,28% de los vasos contengan 
menos de 295 cm 3 ? 

c ) que nivel medio debe ajustarse la maquina para que el 84,13% de los vasos contengan menos 
de 313,46 cm 3 ? 

150. La duracion de las pilas Gato estan distribuidas normalmente con una media de 80 horas y una 
varianza de 100 horas. El fabricante garantiza que reemplazara cualquier pila que falle antes de 
cumplirse la garantia. 

a) ^Cuanto tiempo debe dar de garantia de modo que no mas del 5% de las pilas fallen antes de ese 
tiempo? 

b) Si en una semana vende 500 pilas, ^cuantas reemplazara? 

151. En una fabrica, el tiempo para producir un articulo esta distribuido normalmente, con un promedio 
de 50 minutos y una varianza de 25 minutos. Se debe fabricar una partida de 80.000 articulos. 

a) /,Cuantos articulos requeriran de un tiempo de fabricacion mayor de 53 minutos? 

b) ^Cuantos articulos requeriran de un tiempo de fabricacion no inferior a los 48 minutos, ni 
superior a los 53 minutos? 

c) El 50% de los articulos requeriran de un tiempo de fabricacion entre X 1 y X 2 minutos. Determine 
los valores de X 1 y X 2 , si ellos son simetricos con respecto al tiempo medio. 

152. Un fabricante de transformadores de corriente, asegura que los aparatos que vende tienen una vida 
util media de 80.000 horas y una desviacion estandar de 8.000. Suponiendo que esta vida util esta 
distribuida normalmente. 

a) /,Cual es la probabilidad de que un transformador dure mas de 96.000 horas? 

b) El 50% de los transformadores duran entre X y X horas. Encuentre los valores de X x y X 2 , si ellos 
son simetricos respecto a la media. 

c) El fabricante garantiza que reemplazara gratis cualquier transformador cuya duracion sea 
inferior a X. Determine el valor de X de modo que tenga que reemplazar solo el 1% de los 
transformadores. 

153. Una compania de seguros considera que mas o menos al 0,05 de la poblacion le ocurre cierto tipo 
de accidentes cada ano. La empresa tiene 1.000 asegurados contra este tipo de accidentes. ^Cual es 
la probabilidad de que, como maximo, 35 de ellos sufran este accidente? 
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154. Si en la produccion diaria de envases metalicos de una fabrica se sabe que el 1% son defectuosos, 
^Cual es la probabilidad que de 1.000 envases producidos en un dia: 

a) por lo menos tres no sean buenos. 

b) como maximo 980 buenos? 

155. Se sabe que el 25% de los estudiantes de una universidad usa anteojos. ^Cual es la probabilidad de 
que en un curso de 40 alumnos, a) por lo menos cinco de ellos usen gafas. b) mas de 33 no las usen? 

156. En examen practicado a 1.500 estudiantes, la calificacion promedio fue de 3,6 y la desviacion tipica 
de 0,6. Si las calificaciones se distribuyen normalmente, 

/,Cuantos estudiantes obtuvieron: 

a) calificaciones entre 3,5 y 4,0. b) calificaciones entre 2,0 y 3,0. c) calificaciones de 4,0 y mas? 

157. Si la estatura promedio de un grupo de 1.000 personas fueron de 160 centimetros y la varianza de 
100; ademas se sabe que se distribuyeron normalmente, ^Cuantas personas miden: 

a) entre 140 y 165 centimetros. b) entre 170 y 180 centimetros. 

c) 185 y mas. d) 130 y menos? 

158. Un taller de reparacion de televisores a color, gasta en promedio 45 minutos en el arreglo de un 
aparato, con una desviacion tipica de ocho minutos. Si la poblacion se distribuye normalmente. 
^cual es la probabilidad de que en el arreglo de un televisor se gasten mas de 50 minutos? 

159. La vida util de las pilas de cierta marca estan distribuidas normalmente; si el 6,88% de las pilas 
duran mas de 56 horas y el 30,85% duran menos de 52 horas, 

a) ^Cual es la media y la desviacion tipica? 

b) Si se tienen 400 pilas, ^cuantas de ellas esperamos que tengan una duracion superior a las 56 
horas? 

160. Una cuarta parte de los documentos archivados diariamente por un empleado de un departamento de 
ventas se hace equivocadamente. Si en un dia se archivan 100 documentos, ^cual es la probabilidad 
de que: 

a) por lo menos 18 documentos sean mal archivados. 

b) exactamente 16 documentos sean mal archivados. 

c) exactamente 86 documentos sean correctamente archivados? 

161. Si la vida media de una baterfa de 12 voltios, es de 30 meses, con una desviacion tipica de 6 
meses: 

a) determine que porcentaje de baterias dura menos de 18 meses; 

b) si la garantia establece el cambio de la bateria, si su duracion es menor de 18 meses, ^cuantas 
baterias tendra que cambiar un almacen, de 360 vendidas en el trimestre? 

162. La duracion de ciertas pilas para radio transistor, estan distribuidas normalmente; si el 2,28% duran 
mas de 4,26 meses y 5,36% duran menos de 1,25 meses, determine la duracion media y la desviacion 
estandar. 

163. El peso medio de una fruta es de 4 libras. El 15% de esas frutas pesan menos de 3 libras. Suponiendo 
que los pesos estan distribuidos normalmente, ^cual es la desviacion tipica? 
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164. Un fabricante de juguetes considera que el lanzamiento de un nuevo juguete para navidad producira 
una venta promedio de 80.000 unidades, si ademas piensa que las ventas estan distribuidas 
normalmente y que existe una probabilidad del 25 % de vender mas de 100.000 unidades, ^Cual es 
la desviacion estandar? 

165. Una asignatura se califica de 0 a 100 y al final del curso se observa que las calificaciones estan 
distribuidas normalmente con una media de 72 y una desviacion estandar de 10. 

a) Si el porcentaje minimo para aprobar es 60, ^cual es la probabilidad de fracasos? 

b) Si el 80% de los estudiantes de esa asignatura deben ser aprobados, ^Cual debe ser la calificacion 
minima aprobatoria? 

166. Se ha comprobado que el tiempo necesario para atender a un contribuyente en una oficina de 
recaudacion de impuestos nacionales esta normalmente distribuida, con media de 15 minutos y 
desviacion tipica de 5 minutos. ^Cual es la probabilidad de que un contribuyente seleccionado 
aleatoriamente: 

a) requiera menos de 10 minutos para terminar su diligencia. 

b) dure mas de 20 minutos en la ventanilla? 

167. Una fabrica de cemento empaca su producto en bolsas cuyo peso esta distribuido normalmente, con 
una media de 50 kilos y una varianza de 4 kilos. Encuentre la probabilidad de sacar una bolsa que 
contenga: 

a) por lo menos 51 kilos, b) como maximo 51 kilos, c) de 49 a 52 kilos. 

168. La inspeccion de bolsas de 20 kilos de arroz conducen al resultado de que el 60% pesan entre 19,20 
y 20,80 libras; calcule la varianza, suponiendo que la distribucion es normal. 

169. La fabrica de refresco Tan envasa su producto en frascos cuyo peso neto tiene distribucion normal, 
con desviacion tipica de 6,3 gramos. Si el 8% de los frascos tienen un peso mayor de 142 gramos. 
^Cual es el peso medio de ellos? 

170. El gerente de produccion de una fabrica de bombillas, estima que la vida util del producto esta 
distribuida normalmente, con una media de 5.000 horas. Si, ademas, el gerente considera que hay 
una probabilidad del 60% de que la bombilla dure mas de 5.568 y menos de 4.432 horas, 

a) ^Cual es la desviacion tipica? 

b) Si en un dia se producen 20.000 unidades, ^cuantas esperamos que tengan una duration entre 
4.500 y 5.500 horas? 

171. En una clinica de los Seguros Sociales, se establece que el periodo de hospitalization esta distribuido 
normalmente, con una media de 7,6 dias y una desviacion tipica de 2,2 dias. ^Cual es la probabilidad 
de que un individuo que sea internado permanezca, 

a) por lo menos cuatro dias. b) no mas de nueve dias? 

172. Dado un cuestionario de cierto o falso de 100 preguntas, determinar la probabilidad de que una 
persona acierte, 

a) por lo menos 60 preguntas. 

b) no menos de cuarenta ni mas de 60. 

c) si se presentan 1.000 estudiantes al examen, cuantos esperamos que presenten el resultado del 
punto b? 
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173. Los ingresos de un grupo economico se distribuyen normalmente. La clasificacion de los grupos 
economicos, de mayor a menor ingreso, es la siguiente: 


GRUPO: 

A 

B 

C 

D 

E 

PORCENTAJE: 

8 

16 

42 

20 

14 


El grupo C esta comprendido entre $736,500 y $760,000 quincenales. 

a) Calcular la media y desviacion estandar. 

b) Si en ese sector se ocupan 25.000 personas, ^cuantas se esperan que tengan un ingreso superior 
a $770,000 quincenales? 

174. Los ingresos en cierto sector economico se distribuyen normalmente; la clasificacion de los grupos 
economicos de mayor a menor ingreso, son los siguientes: 


GRUPO: 

A 

B 

C 

D 

E 

PORCENTAJE: 

8 

16 

38 

24 

14 


Si el ingreso del grupo C esta comprendido entre $590,000 y $860,000 semanales, 

a) calcular la media aritmetica y la desviacion tipica. 

b) si en dicho sector se ocupa un total de 23.000 personas ^cuantas esperamos que tengan un 
ingreso inferior a los $500,000? 

175. La duracion de ciertas pilas de radio transistor, estan distribuidas normalmente. Si el 2,30% duran 
menos de 3,8 meses y 54,8% mas de 4,36 meses, a) ^Cual es la media y la desviacion estandar? 
b) Si se tienen 2.000 pilas, ^cuantas esperamos que tengan una duracion superior a los 5 meses? 

176. Se sabe que el 85% de los estudiantes de un curso aprueban el semestre. ^Cual es la probabilidad de 
que 9 o mas de un total de 50, no aprueben? 

177. Un conjunto de 20.000 observaciones tiene una distribution normal con media de 480. Si 4.000 
estan comprendidas entre 470 y 490, 

a) ^cual es la desviacion estandar? 

b) ^cuantas observaciones hay entre 460 y 470? 

178. Si las calificaciones obtenidas en un examen, con notas entre 0 y 100, tienen una distribution 
normal, con media p = 72 y desviacion estandar igual 4, a) ^Cual es la calificacion minima que 
debe recibir un alumno, para estar dentro del 10% de los alumnos que obtuvieron las notas mas 
altas en el examen? b) ^Si entre las calificaciones 60 y 80, hay 20 alumnos, cuantos tiene el curso? 
c ) ^Cual es la maxima nota que debe recibir un estudiante, para encontrarse entre el 72% de los 
alumnos, con las notas mas bajas del examen? 

179. El propietario de un restaurante ha determinado que la demanda diaria de carne molida en su 
negocio tiene una distribution normal, con una media de 240 kg y una varianza de 529 kg 2 . <^Que 
cantidad de came molida debe estar disponible diariamente, para que la probabilidad de que se 
agote la dotation no sea mayor del 2%? 

180. El control de inventarios en las librerfas universitarias es un problema bastante complicado. Si se piden 
pocos ejemplares de un determinado libro, los costos aumentan, por lo que es necesario hacer pedidos 
grandes. Si se piden demasiados ejemplares, se corre el riesgo de que el libro no se requiera como 
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texto en el fiituro, lo que dificultara su venta. Suponga que el promedio de alumnos matriculados en 
estadistica, en la universidad durante un semestre, tiene una distribucion normal, con media de 150 
alumnos por semestre y una desviacion tipica de 20 estudiantes. ^Cuantos libros de texto se deben 
pedir, para que la probabilidad de que se terminen las existencias no sea mayor de 0,10? 

181. La duracion de un determinado tipo de lavadora automatica, tiene una distribucion aproximadamente 
normal, con una media de 3,1 anos y una desviacion tipica de 14,4 meses. Si la lavadora esta 
garantizada por un ano, 

a) ^que proporcion del total de unidades vendidas tendran que ser reemplazadas? 

b) Si se vendieron 500, ^cuantas de ellas seran reemplazadas? 

182. En un examen la nota media fue de 3,5 y la desviacion estandar de 0,5. La calificacion C corresponde 
a notas entre 3,05 y 3,95. Hubo 24 alumnos con nota C. 

a) /,Cuantos alumnos se examinaron? 

b) ^Cuantos perdieron la materia, si para ganar se requiere obtener un 3? 

183. En una distribucion normal, que tiene desviacion tipica 10, la probabilidad de que el valor de la 
variable sea mayor de 65 es 0,19. 

a) Calcular la media de la distribucion 

b) Obtener el valor de la variable que supere al 75% de los valores. 

184. El gerente de produccion de una fabrica de bombillas, estima que la vida util del producto esta 
distribuida normalmente con una media de 5.000 horas. Se estima que hay una probabilidad del 
60% de que la bombilla dure menos de 5.568 horas. 

a) ^Cual es la desviacion tipica? 

b) Si en un dia se producen 20.000 unidades. ^Cuantas esperamos que duren mas de 4.000 horas? 

185. En una distribucion normal que tiene una desviacion tipica de 10, la probabilidad de que el valor de 
una variable sea mayor de 65 es de 0,15, 

a) Calcular la media de la distribucion. 

b) Obtener el valor de la variable que es superado por el 75% de los valores. 


186. Las cajas de carton que contienen un determinado producto pesan en promedio 300 kg cada una y 
tienen una varianza de 2.500 kg ^Cual es la probabilidad de que el peso de una caja sea superior a 
328 kg? 

EJERCICIOSMISCELANEOS 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 



187. Una maquina vendedora de cafe puede regularse de modo que, en promedio, sirva p onzas de cafe 
por taza. Si las onzas servidas por taza tiene una distribucion normal, con desviacion estandar 0,25 
onzas por taza, encuentre el valor de p que permitira que una taza de 7 onzas se derrame el 0,5% 
de las veces. 

188. Si los ingresos de los miembros de una comunidad se distribuyen normalmente con una media de 
$454,000 y una desviacion estandar de $50,000, a) ^Cual es el ingreso minimo que debera tener 
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un miembro de esta comunidad para pertenecer al 10% superior? b) ^Cual es el maximo ingreso 
correspondiente al 50% central? 

189. El gerente de produccion de una fabrica de bombillas estima que la vida util del producto esta 
distribuida normalmente con una media de 5.000 horas. Si, ademas el gerente estima que hay una 
probabilidad del 60% de que la bombilla dure mas de 5.568 horas y menos de 4.432, 

a) ^Cual es la desviacion estandar? 

b) Si en un dia se producen 20.000 unidades, ^cuantas de ellas esperamos que tengan una vida 
inferior a las 4.500 horas? 

190. La vida util de cierto producto esta distribuida normalmente. Si el 17,68% de ellas duran mas de 540 
horas y el 69,83% duran menos de las 486 horas, 

a) ^Cual es la media y desviacion estandar? 

b) Si son reemplazadas aquellas unidades con una vida inferior de 450 horas, ^cuantas se reemplazaran 
si se han vendido 20.000? 

191. Explique brevemente que se entiende por: 

a) Distribucion probabilistica. b) Variable aleatoria discreta. c) Variable aleatoria continua. 

192. Establezca los requisites o condiciones requeridas en la: 

a) Distribucion Binomial, b) Distribucion de Poisson, c) Distribucion Hipergeometrica. 

193. Explique brevemente en que forma sirven de modelos las distribuciones probabilisticas. 

194. Se quiere promocionar un producto especialmente para colocar en la lonchera de los ninos que 
inician sus estudios. Se probo el producto en un grupo de 16 ninos; 10 afirmaron que les agradaba y 
los restantes indicaron lo contrario. Suponga que se seleccionaron 4 personas en dos oportunidades, 
la primera con reposicion y en la segunda sin reposicion ^cual es la probabilidad: 

a) de que, maximo, a dos les agrade. b) por lo menos a tres no les agrade? 

195. En un intento por burlar la vigilancia en la aduana de un aeropuerto, un viajero coloco 6 tabletas 
de narcotico en un frasco que contiene 9 pastillas de vitamina de apariencia semejante. Si el agente 
antinarcoticos selecciona al azar tres tabletas, ^cual es la probabilidad de no arrestar al viajero por 
posesion ilegal de narcoticos? 

196. El numero de radios que en promedio vende una compania por dia es de 1,5. Calcular la probabilidad 
de que la compania venda por lo menos cuatro radios durante un perfodo, 

a) de dos dias. b) de tres dias. c) de cuatro dias. 

197. En una reciente encuesta gubernamental se encontro que el 80% de las familias que viven en 
una comunidad sub-urbana, y cuyos ingresos son superiores a los $860,000, poseen dos hijos. 
Suponiendo que el estudio este en lo cierto, si se selecciona una muestra de 10 familias de esta 
categorfa, obtenga la probabilidad de que: 

a) por lo menos el 20% de los que integran dicha muestra tengan dos hijos. 

b) como maximo, dos tengan un numero de hijos diferentes a dos. 

198. En una planta industrial, los lotes grandes de articulos recibidos se inspeccionan para detectar 
los defectuosos por medio de un esquema de muestreo. Se examinan 10 articulos y el lote sera 
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rechazado si se encuentran dos o mas articulos defectuosos. Si un lote contiene exactamente 5% de 
defectuosos. 

a) /,Cual es la probabilidad de que el lote sea aceptado? 

b) ^Cual es la probabilidad de que el lote sea rechazado? 

199. Supongamos que por cierta interseccion de transito pasan, en promedio 30 autos por hora, ^Cual es 
la probabilidad de que: 

a) en un instante de dos minutos no pase ningun auto por la interseccion? 

b) por lo menos dos autos transiten en un intervalo de seis minutos? 

200. De un inventario de 48 automoviles que se embarcan a distribuidores locales, 12 tienen instalados 
radios defectuosos, ^Cual es la probabilidad de que cierto distribuidor reciba 8 automoviles, 

a) todos con radios buenos. 

b) por lo menos uno con radio defectuoso. 

c) cuantos automoviles con radios defectuosos se esperan recibir? 

201. Por informes suministrados por las companias de seguros, se sabe que en la ciudad, de cada 50 
conductores de vehiculo particular, 40 tienen seguro de responsabilidad civil. Si en un fin de semana 
8 autos de esta ciudad se ven involucrados en accidentes de transito, ^cual es la probabilidad de que: 

a) mas de dos tengan seguro. 

b) por lo menos seis tengan seguro. 

c) como maximo dos no tengan seguro? 

202. El promedio mensual de robos en grandes almacenes de la ciudad, a pesar de la severa vigilancia es 
de 3,2, ^Cual es la probabilidad de que: 

a) no haya robos en una quincena. 

b) mas de dos robos en un perfodo de dos meses. 

c) como maximo dos robos en un mes? 

203. El 0,5% de las cartas que se envian por correo no llevan los timbres postales correctos. En 4.000, 

a) /,Cuantas cartas con timbre incorrectos esperaria encontrar? 

b) ^Cual es la probabilidad de encontrar mas de dos cartas con timbres incorrectos? 

204. El 12% de las personas que reservan cupos en vuelos de avionetas, a menudo no llegan a tiempo 
para abordarlas. La avioneta tiene capacidad para ocho pasajeros. (1) Obtener la probabilidad de 
que las 8 personas aborden la avioneta. (2) Si hicieron reservaciones cinco personas, encuentre la 
probabilidad de que: 

a) se quede una persona, b) no se quede ninguna. 

205. Como resultado de la apertura economica, el 20% de las ventas de automoviles nuevos en Colombia 
son importados. Suponga que se seleccionan al azar 6 personas que han comprado automovil nuevo 
durante la semana pasada. ^Cual es la probabilidad de que: 

a) mas de 5 personas hay an comprado automovil importado. 

b) por lo menos 2 personas hayan comprado vehiculo de fabricacion nacional? 

206. Una de cada 100 lamparas incandescentes fabricadas por una compania se funde antes del final de 
su perfodo de una semana, si se dejan encendidas todo el tiempo. Se instala una lampara en cada 
uno de los cincuenta pisos de un edificio. 
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ual es la probabilidad aproximada de que: 

a) se funda una lampara al final de la semana. 

b) mas de tres lamparas se fundan al final de la semana. 

c) menos de 48 lamparas no se fundan al final de la semana? 

207. El tiempo necesario para atender un automovil en una estacion de gasolina, tiene una distribucion 
normal, con media de 4,5 minutos y desviacion estandar de 72 segundos. 

a) ^Cual es la probabilidad de que un automovil seleccionado en forma aleatoria requiera, cuando 
maximo, 3,5 minutos para el servicio? 

b) ^Cual debe ser el tiempo necesario para el servicio, si el 8% de todos los automoviles requieren 
una cantidad mayor de tiempo? 

208. La puntuacion media en una prueba de ingreso a la universidad es de 500 y la desviacion estandar 
de 75. Las puntuaciones se distribuyen en forma normal. 

a) ^Indique la puntuacion por debajo de la cual quedo el 15% de los estudiantes? 

b) /Jndique la puntuacion por encima de la cual obtuvo calificacion el 32% de los estudiantes? 

c) La universidad establece que los aspirantes con un puntaje entre 350 y 420 se pondran en reserva 
o espera, si hay 3.000 aspirantes, ^cuantos quedaran en la clasificacion de “espera”? 

209. Un almacen de electrodomesticos acaba de recibir una remesa de 20 aparatos de T.V. Poco despues 
de recibirlos, el fabricante llamo para informar que por descuido se habian enviado 6 aparatos 
defectuosos. Se decidio probar dos de los aparatos. 

a) /,Cual es la probabilidad de que ninguno de los dos este defectuoso? 

b) <^Que los dos esten buenos? 

210. En una Universidad el Departamento de economia y matematicas esta conformado por 40 profesores, 
12 de los cuales son de planta. El decano selecciona al azar 5 profesores del departamento para 
revisar el plan de estudios ^Cual es la probabilidad de que: 

a) todos sean de planta. 

b) todos no sean de planta. 

c) por lo menos dos sean de planta? 

211. Un colegio de la ciudad, cuenta con 18 buses para recoger y regresar los alumnos a su casa. 
Supongamos que 6 de ellos tienen problemas mecanicos. Se seleccionan 6 vehiculos al azar para 
probarlos. ^Cual es la probabilidad de que: 

a) ninguno tenga fallas mecanicas? 

b) dos de ellos tengan fallas mecanicas? 

c) por lo menos dos no tengan fallas? 

212. El grupo de secretarias de una empresa esta conformada por 30 personas, 12 de las cuales llevan 
trabajando mas de cinco anos. Si la direccion requiere para un trabajo especial cinco secretarias y 
son elegidas al azar, ^cual es la probabilidad de que: 

a) ninguna de las secretarias tendran mas de 5 anos de experiencia. 

b) dos de las secretarias tendran mas de 5 anos de experiencia. 

c) por lo menos una no tendra mas de 5 anos de experiencia? 

213. Un determinado producto industrial se embarca en lotes de 30 unidades, con el proposito de 
minimizar el numero de unidades defectuosas enviados a los diferentes distribuidores, se elaboro un 
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programa de inspeccion que consiste en tomar una muestra de 8 unidades de cada lote y rechazarlo 
si se observa mas de cierto numero de unidades defectuosas: 

a) Si la decision es de rechazar el lote si se observa mas de un articulo defectuoso en la muestra 
(a sabiendas de que el fabricante estima que cada lote contiene 4 defectuosos) ^Cual es la 
probabilidad de que sea aceptado? 

b) Si el fabricante estima que cada lote tiene 17 articulos buenos, ^cual es la probabilidad de 
aceptar el lote con menos de dos defectuosos, en una muestra de ocho articulos? 



1 Informacion que debe tenerse en cuenta en la solucion de ejercicios sobre distribucion 
probabilistica, ya sea discreta o continua. 

DISTRIBUCIONES DE PROBABILIDAD 


Binomial —► 

Poisson 

n 

P 

q 
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n (grande) 
p(muy pequenos) 
q(muy grande) 
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Hipergeometrica 
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11 
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P 
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o 

X 


X 


Formulas 



Variables aleatorias discretas Variables 


aleatarias 

continuas 


2. La distribucion Binomial, Poisson y la Normal se aplican en aquellos experimentos que 
solo tienen dos resultados, exito o fracaso. 

3. La distribucion normal presenta las siguientes caracteristicas: 

a) Simetrica. 

b) Es asintotica. 

c) El area bajo la curva, es aproximadamente del 100%. 

d) La media, se localiza en el centra de la campana. 

e) Se puede aplicar en los ejercicios de distribucion Binomial, siendo su resultado un 
valor aproximado. 
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4. La distribucion H ipergeometrica se aplica al muestrear sin reposicion. Por tanto la 
probabilidad de exito no es constante. Su calculo es tedioso cuando n es grande. En 
muchos casos sus resultados son casi iguales al de la Binomial, por lo tanto se procede 
a resolverlos por este ultimo metodo. Las pruebas son dependientes. 

5. La distribucion de Poisson se aplica en ejercicios de Binomial, solo cuando n es muy 
grande y la probabilidad de exito es muy pequena. 

6. En la distribucion Binomial, la probabilidad de exito debe ser constante para cada 
ensayo sucesivo. 

7. La H ipergeometrica se aplica cuando pueden ocurrir dos o mas resultados. 

8. Cada distribucion normal queda totalmente especificada por su media y desviacion 
estandar; por lo tanto se tendra una distribucion normal, diferente para cada media y su 
desviacion estandar. 
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ALGUNOSCONCEPTOSSOBRE MUESTREO 


Hoy, la estadistica esta considerada como la teorfa de la informacion, no solo como funcion descriptiva, 
sino con el objeto basico de hacer estimaciones acerca de los valores estadisticos de la poblacion o en la 
comprobacion de hipotesis de aquellas caracteristicas que han sido investigadas. 

Se recomienda volver a leer el Capitulo 1, lo mismo que el Capitulo 13, donde se podran ampliar 
estos conceptos de Muestreo, importantes para el desarrollo no solo de este sino de los siguientes. 

De los anteriores contenidos se observa que la estadistica cubre dos aspectos de gran importancia: la 
estadistica descriptiva a traves de la recoleccion, clasificacion, presentation , ya sea en forma de cuadros 
o graficas, la apli cation de medidas como promedios, desviaciones, etc., y la interpretation y analisis de 
datos a fin de obtener conclusiones. Se realiza un proceso deductivo de lo general a lo particular. 

El segundo aspecto es la inferentia estadistica o metodo inductivo , el cual, mediante investigacio- 
nes por muestreo, logra obtener resultados considerados como estimadores de los valores estadisticos, 
correspondientes a las caracteristicas de las unidades que conforman la poblacion, correspondiendo al 
metodo inductivo, que denominaremos inferencia. 

Se podria afirmar que la tarea mas importante de la estadistica es la realizacion de inferentias acer¬ 
ca de una poblacion objetivo, con base en los resultados obtenidos a traves de una muestra. 

Hacemos una pequena sintesis de los que consideramos que el alumno debe recordar y afianzar. 

P oblation 0 uni verso se puede definir como un conjunto de elementos o de unidades en una poblacion. 

El elemento o unidad puede ser una persona, familia, empresa, zona, animal u objeto. 

Del elemento se estudian sus caracteristicas. Estas se clasifican en: cualitativas o atributos , expre- 
sadas por palabras y se cuantifican mediante el conteo o recuento; las cuantitativas 0 variables expre- 
sadas en forma numerica, que pueden ser medidas ( variable continua) o contadas ( variable discreta). 

De acuerdo con lo anterior, la poblacion puede definirse como un conjunto de medidas, o el recuen¬ 
to de todas las unidades que presentan una caracteristica comun. Se podria definir como un conjunto de 
mediciones, finito o infinito, real o conceptual. 

M arc0 muestral. Es un listado, actualizado y revisado, de todos los elementos que constituyen la 
poblacion que va a ser objeto de investigacion. Tambien puede ser un mapa o croquis con las unidades 
de selection plenamente identificadas. 

Encuesta preliminar, piloto 0 pretest. Antes de iniciar la investigacion, se recomienda realizar una 
pequena encuesta preliminar con el fin de probar el cuestionario, conocer mejor la poblacion, entrenar al 
entrevistador, determinar el tiempo que requiere la entrevista y en especial tener un mayor conocimiento 
acerca de algunos parametros. 
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La poblacion se clasifica en: finita o infinita 

Cuando se investigan las caracteristicas de todas las unidades que constituyen la poblacion o universo, 
nos referimos a una investigation total, exhaustiva o censo. 


Factores tales como: costo, tiempo, recursos humanos, poblaciones muy grandes 
o infinitas, destruction de la unidadsometida a control, caracteristicas con gran 
homogeneidad , impiden la realizacion del censo. Se sustituye, entonces, por una 
investigacion partial o muestra. 


El objetivo principal de muestreo es considerar el mayor numero de unidades con el menor costo 
posible. 

La muestra , para que sea representativa de la poblacion, requiere que todas las unidades de la 
poblacion tengan la misma probabilidad de ser seleccionadas, es decir, debe ser aleatoria, al azar 0 
probabilistica. 

El muestreo aleatorio, realizado bajo ciertas condiciones y sometido a cumplir ciertos requisitos, se 
constituye en un procedimiento practico, economico y rapido para generalizar conclusiones obtenidas a 
traves de una muestra, aplicables a toda la poblacion de la que forma parte, dentro de ciertos limites de 
confiabilidad, establecidos de antemano. 

Dentro del M uestreo aleatorio , se tienen los siguientes metodos: 

□ M uestreo aleatorio simple o muestreo aleatorio irrestricto, en el cual se da igual oportunidad de 
seleccion a cada elemento o unidad dentro de la poblacion. 

□ Muestreo aleatorio estratificado (Asignacion igual, proporcional y optimo), garantiza la 
representatividad, reduciendo el error de la muestra al formar grupos o subpoblaciones mas 
o menos homogeneas, en cuanto a su composicion interna y heterogenea cuando se comparan 
entre si. 

□ M uestreo por conglomerados , por areas o geografico. Cuando la unidad basica de muestreo 
se encuentra en la poblacion en grupos o conglomerados y la seleccion de la unidad permite la 
observacion del total de elementos de cada conglomerado elegido. Cada conglomerado tiene 
las mismas caracteristicas de la poblacion; puede hacerse un segundo muestreo dentro del 
conglomerado seleccionado, denominandose de doble etapa o bietapico. 

Generalmente es muy aplicado cuando no se dispone de un marco de referencia completo. El 
area total se divide en pequenas areas que son muestreadas. Cada area seleccionada podra ser 
subdividida y enumerada para una nueva seleccion, si es necesario, y asi sucesivamente dando 
origen al muestreo por etapas o polietapicos. 

□ M uestreo por fases. En ocasiones, es conveniente y economico recoger cierta informacion de la 
totalidad de elementos de una muestra, la cual se extrae de la poblacion en tal forma que sea lo 
suficientemente grande. Ademas, la necesidad de informacion mas detallada obliga a una nueva 
muestra proveniente de la anterior, ocasionando un muestreo de dos fases o bifasico. Puede 
considerarse, tambien, de varias fases o polifasico. 

□ □ M uestreo si sterna tico. La seleccion de las unidades se hace a intervalos regulares, en un 
orden sistematico. 
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Las condiciones del muestreo aleatorio implican consideraciones importan- 
tes: (a) se debe seguir un diseno estadistico especifico (muestreo aleatorio, 
simple, estratificado, etc.); el mejor es aquel que proporciona la precision 
necesaria, en terminos de un limite, en cuanto al error de estimacion a un 
menor costo; (b) la seleccidn de los elementOS al azar, para luego recolectar 
la informacion por cualquiera de los metodos: entrevista, observacion directa, 
correo, telefono, etc.; (c) el error muestral , es decir, la diferencia que debe 
haber entre el resultado realizado mediante la muestra y el obtenido posible- 
mente mediante la investigacion total o censo. 


EI error de estimacion , es la diferencia que puede haber entre la estimacion puntual y el parametro. 
Cuando la estimacion no representa bien al parametro, a pesar de estar perfectamente disenada, nos refe- 
riremos a errores muestrales; los errores no muestrales son ocasionados por el mal diseno del formulario, 
errores cometidos en el proceso de recoleccion, procesamiento y analisis de los datos. 

Parametro (poblacional), son las medidas descriptivas numericas aplicadas a las caracteristicas en 
las unidades de la poblacion. Tambien se les denomina como valores estadisticos de la poblacion. 

Estimador puntual, son las medidas descriptivas numericas aplicadas a las caracteristicas en las uni¬ 
dades de la muestra. Se podra decir que el estimador es una norma o metodo para estimar una constante 
perteneciente a una poblacion. La estimacion hace referencia a los valores numericos de los parametros 
poblacionales desconocidos, a los cuales se llega mediante una muestra. 

El estimador por intervalos , es una regia que nos indica como calcular dos puntos o valores a traves 
de una muestra. La estimacion por intervalos es la estimacion del parametro mediante la especificacion 
de un intervalo de valores, determinado por un limite inferior y otro superior (limites de confianza) den- 
tro del cual estara comprendido el valor verdadero o parametro poblacional. 


Se dice que un buen estimador debe ser: 

□ / nsesgado es decir que no tenga sesgo, error o bias, cuando el valor del estimado 
es igual al del parametro. En caso contrario la estimacion sera sesgada. 

□ Consistente es aquel estimador que, al aumentar el tamano de la muestra, 
converge en probabilidad al parametro que estima. 

□ Eficiente es el estimador que tiene la menor varianza entre todos los estimadores 
posibles. 

□ Suficiente cuando incluye toda la informacion que la muestra puede proporcionar 
acerca del parametro. 


El intervalo de confianza , corresponde a un intervalo de valores, dentro de los cuales se espera que 
este el parametro con cierto grado de confianza o con riesgo de error conocido; para ello es necesario 
determinar primero la estimacion puntual. 
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La probabilidad de que un intervalo de confianza contenga el parametro que se estima, se denomina 
coeficiente de confianza. 

Se han visto una de serie de terminos y definiciones con respecto al muestreo dledtorio. Tambien 
existe el muestreo no dledtorio , circunstdncidl o errdtico , metodo cuyos resultados o estimaciones no 
son de ninguna manera confiables, dado que la seleccion de las unidades que conforman la muestra, se 
realiza en forma caprichosa o por conveniencia, primando en muchos casos el juicio personal del inves- 
tigador. 

Dentro del muestreo no aleatorio existen algunos metodos tales como: 


□ Muestreo a juicio , intenciondl u opindtico , donde los elementos seleccionan a 
juicio o en opinion del investigador; se podria decir que prima la intencion de 
que estas unidades sean incluidas dentro de la muestra. 

□ M uestreo por conveniencid , donde se eligen los elementos mas al alcance del 
investigador. 

□ Muestreo voluntdrio, donde el informante, voluntariamente, suministra 
informacion sin ser previamente seleccionado. 

□ M uestreo por CUOtdS , es un numero de entrevistas, encuestas, condiciones o 
cuotas que se le fijan al encuestador para que a su vez seleccione los elementos 
en la forma que considere oportuna. 


EncuestdS descriptivdS y dndlltiCdS. Algunos autores clasifican las encuestas, en terminos generales 
como: encuestas descriptivas y encuestas analiticas. En las primeras, el interes se especifica en la obtencion 
de alguna informacion correspondiente a una poblacion. En las otras, la finalidad es analizar ciertas hipo- 
tesis o supuestos acerca de la poblacion, que el investigador se fijo de antemano. Hay encuestas que sirven 
para ambos propositos. 

DISTRIBUCIONES MUESTRALES 

Corresponden a una distribucion de todas las muestras que pueden ser escogidas conforme a un esquema 
de muestreo especificado, que implique seleccion a azar y, a una funcion de un numero fijo de variables 
aleatorias independientes. 

De una poblacion a estudiar, se selecciona una sola muestra de todas las muestras posibles de igual 
tamano, con el fin de obtener conclusiones sobre la poblacion, no sobre la muestra. 

La seleccion de las unidades que van a conformar la muestra debe hacerse al azar, mediante 
un generador de numeros aleatorios, usando cualquier metodo: sorteo, tablas de numeros aleatorios, 
sistematico, calculadora o EXCEL. 

La aplicacion de EXCEL en la seleccion de elementos, se dan tres (3) opciones o metodos que usted 
puede consul tar en el capitulo 13. 

Se presentan a continuacion cuatro tipos de distribucion: 
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DISTRIBUCION DE M EDIAS M UESTRALES 7 

Simbologia que sera utilizada en este capitulo: 


MEDIDAS 

POBLACION 

MUESTRA 

Media aritmetica 

M 

X 

Varianza 

cr 2 

S 2 

Desviacion tipica 

<j 

S 

Tamano 

N 

n 


/u y = Media de todas las medias muestrales 

cr_ = Desviacion tipica de todas las medias muestrales. 

M = Numero de muestras posibles. 


M = \ = — Cuando la seleccion se hace sin reposicion. 

yn j (N-n) n 


M = N ri Cuando se hace la seleccion con reposicion. 

En el capitulo 13 se da orientacion mucho mas amplia sobre el uso de algunos de los metodos de 
seleccion de elementos o unidades, mas utilizados. 

Si consideramos una poblacion de N elementos, con media p y desviacion tipica cr, si se obtienen 
M numero de muestras posibles, de tamano D, simbolizamos a cada media muestral, 



Teorema. Dada una poblacion, si extraemos todas las muestras posibles de 
un mismo tamano, entonces la media de la distribucion de todas las medias 
muestrales posibles, sera igual a la media poblacional. 
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Simbolizaremos la media de toddS las medidS muestrales por f.l j , la cual sera igual a la media 
poblacional 

2 

x M M 

JLi=Hx = Media de la distribucion de muestreo. 

La media de todas las medias muestrales debe ser exactamente igual a la media poblacional (ju), 
debido a que la distribucion de muestreo resulta de todas las muestras posibles que se pueden extraer de 
una poblacion; por tal razon incluye todos sus elementos. De ahi, que calcularla es un metodo indirecto 
para obtener el valor del parametro ^. 

La varianza de todas las medias muestrales se simboliza por o\ y el error estandar de la media, 
sera igual <r_ 

_ | X X i~ ^ _ I ( X 1 ~ mT + ( X 2 — mY _ O 

J v m v M JYi 


media) 


o 

4n 


Siendo <J T =-^= (para muestras grandes o sea D > 30 el cual se denomina: error estandar de la 


a- = Desviacion estandar de la distribucion de muestreo de medias, que depende de la dispersion 
de la poblacion y del tamano de la muestra. 

Si el tamano muestral (fl) no es una fraccion pequena del tamano poblacional, lo mas adecuado es 

considerar el error estandar de la media, como < 7 - = ^ 

V n 

La expresion N ~ n S e conoce como factor de correccion para poblacion finita. 

N -1 

Ejemplo 1. Supongamos una poblacion de 5 elementos (N=5) y los valores que toma la variable, 
dependiendo de la unidad de medida utilizada, ya sean kilometros, metros, valores, etc., son: 

N = 5 => siendo: X x = 7 X 2 = 3 X 3 = 5 X 4 = 8 X 5 = 2 


N-n 
N -1 


Con los anteriores valores se puede calcular la media, la varianza y desviacion tipica poblacional. 


t* = 


M 



Xv 2 -A^ 2 _ 151-5(25) 
N ~ 5 


a = 7^2 = 2,2 


Ahora determinaremos el numero de muestras posibles (M) de esta poblacion, si el tamano de la 
muestra que fijamos arbitrariamente es 2 y si la seleccion se hace sin repetition o reposition. En el primer 
caso, se tendra que: 


M = C r =- 


N 


N-n n 


M = C\ =tA- = 10 
2 2 3 


El numero de las combinaciones que se pueden obtener considerando los 5 elementos, son: 

V V *1*4 V V *2 V *3 V 

V V V V *2*4 *3*4 *4 V 
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= 


x 2 +x 4 _ 3 + 


Calculemos la medid aritmetica para cada una de las posibles muestras. 

= 5,5 
= 2,5 
= 6,5 
= 3,5 
= 5,0 


- _x l +x 2 _7 + 3_c 

— — — J 

n 2 


x 2 =^1=7±5=6 

2 n 2 


_x : +x 4 _7+ _ 7S 
n 2 

_ _x 1 +x 5 _7 + 2_ 


4,5 


_ x 9 + x 3 _ 3 + 5 


x, =- 


- = 4 


no 


n 

2 

x 2 +x 5 

3 + 2 

n 

2 

x 3 +x 4 

5 + 

n 

2 

X 3 +X 5 

_ 5 + 2 . 

n 

2 

x 4 +x 5 

+ 2 


La media de todas las medias muestrales sera igual a: 

£x, _ 5 + 6 + .... + 5 _ 25 


Aj=- 


= — =5 
5 


M 10 

Se podra observar que se cumple el teorema, que la media de todas las medias muestrales es igual 
ala media poblacional. /u 2 = // = 5 

En cuanto a la desviacion tfpica de todas las medias muestrales, encontramos que: 


= 1 ( 5 - 5 ?+( 6 - 5 ? + -±^I = ^ = 13 

\ M v 10 ^ 

Lo anterior deberia ser igual a cf^ = -^= denominado como error estandar de la media, el cual se 

yjn 

cumple tan solo cuando el tamano de la muestra (D) es grande. Algunos autores consideran que D es 
grande, cuando es mayor a 30 (D > 30) y es pequena, cuando D es menor o igual a 30 (D < 30). Es esta 
la razon por la cual, al calcular el error estandar de la media, utilizando la desviacion tfpica poblacional 
(a), el resultado es diferente a 1,39. Veamoslo: 


2,2 2,2 


^ 4n V2 1,414 


= 1,61 ^ 1,3 


En el caso de hacerse la seleccidn con reposicidn, se tendra que M = N n = 5 2 = 25 y las combina- 
ciones posibles son: 


X, x 2 XV x 2 x 3 X 3 x 2 x 3 x 4 x 4 x 3 x 4 x 5 

x t x 3 X 3 x 3 X 2 x 4 x 4 x 2 x 3 x 5 x 5 x 3 x 5 x 4 

I,I 4 X 4 x 3 X 2 x 5 x 5 x 2 x 3 x 3 x 5 x 5 

x,x 5 X 5 x l 1 , 1 , XX XX 


Los resultados seran los mismos, es decir, /i = 5 y Oj - 1,39. Es de anotar que, cuando se hace la 
seleccion sin reposicion, la poblacion se vuelve infinita y que en cada extraccion o seleccion, el elemento 
o unidad puede ser nuevamente seleccionado y asi sucesivamente. 
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Figura 7.1 



La representacion grafica de la distribucion muestral de las 25 medias muestrales, to- 
mando como ejemplo las P% obtenidas, cuando la seleccion la hacemos con reposicion 


p — J 

(I=5) 25 

^=4) 25 

P - 2 

^= 6 ) - 25 

P - 2 

■ r (x=5,5) 25 

P - 2 

P {l=l,5)- 25 

p -A 

r (x=2,5) 25 

p - 2 

(1=4,5) 25 

p - 2 

\x=6,5) 25 


p - 2 

^=3,5) 25 


p — 1 

r (x=ifi) 25 

P - J_ 

p (*=3) ~ 25 

P =_L 

(J=s) 25 

P =J_ 

(J=2) 25 


Teona del I finite central. Se cumple, cuando independientemente de la poblacion origen, la 
distribucion de las medias aleatorias se aproximan a una distribucion normal a medida que 
el tamano de la muestra crece. Se podra decir tambien, que si las muestras provienen de una 
poblacion que no es normal, es de importancia tener en cuenta el tamano de la muestra, si 
el tamano muestral es pequeno, la distribucion obtenida con sus medias muestrales tendran 
un comportamiento similar al de la poblacion de donde se extrajeron. Por el contrario, si el 
tamano muestral es grande, el comportamiento de estas medias muestrales sera igual al de 
una distribucion normal, independientemente de la poblacion de donde fueron extraidas. 

En su forma mas simple, el teorema indica que si n variables aleatorias independientes 
tienen varianzas finitas, su suma, cuando se le expresa en medida estandar, tienden a estar 
normalmente distribuidas cuando D tiende a infinite. Se debe observar que ninguna de las 
varianzas sea mayor comparada con el total. 
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De acuerdo con el teorema anterior, la variante estadistica Z para distribuciones de medias mues- 
trales sera: 


= Por la cual consideramos que se 

(jj g 4n aproxima a un distribucion normal. 


E jemplo 1. La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y su desviacion 
tipica es de 0,25 mts. Determinar la probabilidad de que en una muestra de 36 alumnos, la media sea 
superior a 1,60 mts. 

_ 0,5000 

* ° •' M*> 1 , 60 ) ~~ 

v = 1,60-1,50 = 0,10 _ 0,60 
0,25 0,25 0,25 

V36 6 

Z = 2,40 —> A 0,4 1 
P = 0,5000 - 0,4 1 = 0,00 2 = 0, 2 p (*>i,eo) = °> 2 

Ejemplo 2. Se tiene para la venta un lote de 1.000 polios, con un peso promedio de 3,50 kg y una 
desviacion estandar de 0,18 kg, ^Cual es la probabilidad de que en una muestra aleatoria, 100 polios de 
esta poblacion, pesen entre 3,53 y 3,56 kg? 

- o : H — 3,5 o =0,1 n —100 ^( 3 , 53 <x< 3 , 56 ) = 




ry_ x ~M_ 3,56 - 3,5 _ 0,06 10 

o _ 0,1 0,1 

4n VlOO 

Z = 3,33 —> A 0,4 6 


7 3,53-3,5 0,03 10 

Z = ——-=-= 1,00 


0,4 6 


0,1 

Vioo 


0,1 


Z = 1,66 —> A 0,4515 
P = 0,4 6-0,4515 = 0,04 1 



1,66 3,33 


P - 4 1 

r 3,53<x<3,56 — 1 


Ejemplo 3. Un fabricante de cierto champu para el cabello, distribuye el tamano profesional de su 
producto en 100 salones de belleza de Caracas. Se ha determinado que el consumo promedio de su 
producto es de 2.800 cojines mensuales, con desviacion estandar de 280 cojines. Si se toma una muestra 
probabilistica de 36 salones, ^cual es la probabilidad de que el consumo promedio en un mes sea inferior 
a 2.700? 


o 


JU = 2 00 


o= 2 0 


n =36 


^(*<2 700) — 
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Z = 


x-JJ L _ 2 700-2 00 


a 

4n 


2 0 
36 


-100 6 
2 0 


= -2,14 


0,5000 



z 


2,14 0 


Z = -2,14 —>A 0,4 3 
P = 0,5000-0,4 3 =0,0162 


x<2 700 


= 1,62 


En aquellos casos de poblaciones finitas, es decir, cuando se da information sobre el tamano 
poblacional, y cuando el tamano de la muestra es mayor del 5% de la poblacion, se puede aplicar el factor 
de correction, representado de diferentes maneras; cualquiera de las siguientes formas podran ser aplicadas: 


N — n _ l N — n 

N-1 “V N 



Factor de correccion para poblaciones finitas. 


La f se conoce como fraction de muestreo. 



Por lo tanto la desviacion estandar de la muestra se convierte en <j- =^=.\——— 

4n * N-\ 

En distribuciones de medias muestrales, la estandarizacion de Z, incluyendo el factor de correccion 
para poblaciones finitas sera: 

N-l 



Ejemplo 4. Si en el ejemplo (1) se considera que dicho plantel de secundaria tiene un total de N = 400 
alumnos, ^Cual es la probabilidad, en una muestra de 36 alumnos, de que la media sea superior a 1,60m.? 


x - 

-M 


lN-n 


1 N-l 

1,60-1,50 

0,25 

/ 400-36 

V36 

V 400-1 


Z = 2,51 —> 0,4 40 

P = 0,5000 -0,4 40 = 0,006 


0,5000 



0 2,51 


-^*> 1,60 — 0>6 
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EJERC 1C IQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

1. En una poblacion normal, con media 72,1 y desviacion estandar 3,1, encuentre la probabilidad de 
que en una muestra de 90 observaciones, la media sea menor que 71,7. 

2. En un banco de ahorros, la cuenta media es de $659,320, con una desviacion de $ 18.000. /,Cual es la 
probabilidad de que un grupo de 400 cuentas, elegidas al azar, tenga un deposito medio de $660,000 
o mas? 

3. En cierta region los salarios diarios de los mineros del carbon estan distribuidos normalmente con 
una media de $864,500 y una desviacion estandar de $15,000. ^Cual es la probabilidad de que una 
muestra representativa de 25 mineros, tenga un promedio diario inferior a $857,500? 

4. Las estaturas de cierto grupo de adultos tienen una media de 167,42 y una desviacion estandar de 
2,58 centimetros. Si las estaturas estan normalmente distribuidas y se eligen aleatoriamente 25 
personas del grupo, ^cual es la probabilidad de que su media sea de 168,00 centimetros o mas? 

5. Si se extrae una muestra aleatoria de 36 elementos de una poblacion, ^cuantos elementos debe 
contener otra muestra de la misma poblacion, para que el error estandar de la media de la segunda 
muestra, sea 2/3 del error estandar de la media de la primera muestra? 

6. Si se extraen dos muestras aleatorias de una misma poblacion, y si el error estandar de la media de 
una de ellas, es k veces el error estandar de la media de otra, ^cual es la relacion entre los tamanos 
de ambas muestras? 

7. Los salarios diarios en cierta industria estan distribuidos normalmente con un media de $23,000. Si 
el 9% de las medias de los salarios diarios en muestras de 25 obreros, es inferior a $22,500, ^cual 
es la desviacion estandar de los salarios diarios en esta industria? 

8. Supongamos que se tienen, en una uma, 500 fichas numeradas 1, 2, 3,.... 499, 500. Despues de 
mezclarlas completamente, se sacanl6 fichas aleatoriamente. ^Cual es la probabilidad de que la 
suma sea mayor de 3.000? 

9. Si los pesos individuates de las personas que viajan en avion se distribuyen normalmente con media 
de 68 kilos y desviacion tipica de 3,5 kilos, ^cual es la probabilidad de que un Boeing 707 con 81 
pasajeros pesen mas de 5.700 kilos? 

10. Las estaturas de los estudiantes de una universidad, se distribuyen normalmente con media de 170 
centimetros y desviacion tipica de 18 centimetros. Si se toma una muestra de 81 estudiantes, ^cual 
es la probabilidad de que tengan una estatura superior a 175 centimetros? 

11. Quinientos cojinetes de bolas tienen un peso medio de 5,02 onzas y una desviacion de 0,30 onzas. 
Hallar la probabilidad de que una muestra al azar de 100 cojinetes, elegidos entre este grupo, tengan 
un peso de mas de 5,10 onzas. 

12. Una siderurgica esta produciendo actualmente cables para suspension de puentes. La caracterfstica 
mas importante de este producto es su resistencia, el peso que puede soportar antes de que se 
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reviente. Por experiencias pasadas se sabe que el promedio de la resistencia es de 6 toneladas con 
desviacion tipica de % de tonelada. Para efectos de control, se selecciona una muestra de 9 cables y 
se adopta la siguiente regia de decision: 

Si la resistencia promedio esta por encima de 6,5 toneladas o por debajo de 5,5, se suspende el 
proceso. Si esta entre 5,5 y 6,5 se deja tal y como esta. 

a ^Cual es la probabilidad de detener el proceso, si la media de la produccion es aun de 6 
toneladas? 

b) ^Cual es la probabilidad de detener el proceso, si la media de la produccion no es 6 toneladas 
sino 6,18 toneladas? 

c) /,Cual es la probabilidad de continuar el proceso, si el promedio es en realidad de 6,4 
toneladas? 

d) ^Si es de 5,8 toneladas? 

13. Suponga que una maquina produce tornillos cuyos diametros se distribuyen normalmente con media 
p = Vi pulgada y una desviacion tipica a = 0,01 pulgadas. 

^Cual es la probabilidad de que el diametro medio este comprendido entre 0,49 y 0,51, para una 
muestra de 4 tornillos? 

14. Una compania productora de maiz hibrido afirma que sus productos daran, por termino medio, 120 

bultos por hectarea. Veinticinco hectareas producen, en promedio, 115 bultos. Si se supone que la 
desviacion tipica G, es de 10 bultos por hectarea, ^cual es la probabilidad de obtener una media 
muestral de 115 o menos? 

15. En una distribucion normal se seleccionan todas las posibles muestras de tamano 10; si el 2% de 
estas muestras tienen medias que difieren de la media poblacional en mas de 4 en valor absoluto, 
encontrar la desviacion estandar de la poblacion. 

16. Ciertos tubos fabricados por una compama tienen una duracion media de 900 horas y una desviacion 
tipica de 70 horas. Hallar la probabilidad, al seleccionar al azar 36 tubos, que tengan una duracion 
media entre 870 y 925 horas. 

17. Se sabe que en cierta gran ciudad, los clientes de los restaurantes gastan en promedio $32,900 
en comida, con una desviacion estandar de $1,500. Si se pide a cada uno de 50 restaurantes que 
seleccionen al azar las cuentas de 100 personas y que informen sobre el consumo medio de esas 100 
personas, ^de cuantos restaurantes debe esperarse que informen sobre cuentas promedio, superiores 
$33,259,30? 

18. Los pesos de los paquetes recibidos en una bodega tienen una media de 580 libras y una desviacion 
tipica de 80 libras, ^cual es la probabilidad de que el peso de 49 paquetes recibidos al azar y 
cargados en un montacargas, supere su capacidad de 30.000 libras? 

19. En una universidad el promedio de calificacion, en examenes de admision, ha sido de 3,5 con una 
desviacion tipica de 1. ^Cual es la probabilidad, si el examen lo presentan 36 estudiantes, de que 
obtengan un promedio mayor de 3,7? 

20. El valor promedio de los pedidos que hacen los detallistas de una ciudad a cierto mayorista es 
de $25,900 diarios, con desviacion estandar de $1,800. Si elegimos al azar una muestra de 200 
pedidos, ^cual es la probabilidad de que la media de valor del los pedidos sea superior a $26,100? 
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21. Una firma de ingenieros ha estimado que el peso promedio de los adultos que viviran en un edificio de 
apartamentos es de 68 kilos, con desviacion estandar de 15 kg. De acuerdo con la anterior estimacion, 
instalan en el edificio un ascensor para 36 personas con capacidad de 2.700 kilos; si la estimacion es 
correcta, ^cual es la probabilidad de que un cupo completo exceda la capacidad del ascensor? 

22. Un distribuidor mayorista recibe mensualmente 70.000 pilas de 1,5 voltios. Para decidir si acepta 
o rechaza las pilas, utiliza la siguiente regia de decision: mide la vida util de 36 pilas. Si la media 
de la muestra es 60 o mas horas, se acepta la totalidad; en caso contrario, se rechaza. /,Cual es la 
probabilidad de: 

a) aceptar una remesa que tiene una vida util de 59 horas y una desviacion estandar de 3 horas? 

b) rechazar un cargamento que tiene una vida util de 60,5 horas y una desviacion estandar de 3 horas? 

23. El gerente de una cooperativa de ahorro y vivienda, estima que el promedio de ahorro por cliente 
en un mes es de $520,000 con una desviacion tipica de $222,960. ^Cual es la probabilidad de que 
al examinar 36 cuentas, el promedio de ahorro se mayor de $630,000? 

24. Un profesor sabe por experiencia que el examen final realizado a sus alumnos, proporciona una 
calificacion promedio de 68 y una varianza de 441. El curso actual lo conforman 36 alumnos. /,Cual 
es la probabilidad de que el rendimiento medio sea menor de 60? 

25. El gerente de una empresa asegura que su programa de entrenamiento en ventas permite aumentarlas 
mas del 10% sobre $400,000 pesos diarios actuales, con una desviacion estandar de $78,608. Si 
selecciona un grupo de 25 vendedores, ^cual es la probabilidad de que el gerente tenga la razon? 

26. Un almacen ofrece cargos de empacadores de mercancia con un promedio de 58 cajas y desviacion 
estandar de 16. En cada caja se pueden empacar 5 docenas de camisas, colocandole a cada una su 
marca distintiva. Si se toma una muestra aleatoria de 16 aspirantes a los cargos y se les somete a un 
dia de prueba, ^cual es la probabilidad de que empaquen, en promedio, entre 50 y 70 cajas en el dia? 

27. A vendedores de libros, una distribuidora les asegura que ademas de su sueldo basico de $660,000 
mensuales, obtendran un promedio mensual de $240,000 por comision. Si la distribuidora emplea 
a 25 vendedores, ^cual es la probabilidad de que el ingreso promedio por comision sea inferior a 
$237,000? Se admite que la comision por venta de libros tiene una desviacion tipica de $8,200. 

28. En un supermercado se establece que los paquetes de cafe de libra, tienen un promedio 1,03 libras, 
con una desviacion tipica de 0,05 libras. ^Cual es la probabilidad de seleccionar 28 paquetes 
(marcados de libra) con un peso promedio superior a 1,02 libras? 

29. Un auditor toma una muestra de tamano 49, de una poblacion de 800 cuentas por cobrar. La 
desviacion estandar de la poblacion es de $93,800 y la media es $226,000. ^Cual es la probabilidad 
de que la media de la muestra, sea menor igual a $206,000? 

30. Un analista financiero selecciona una muestra aleatoria del 8% de 500 cuentas. La media y la desviacion 
tipica, de los saldos encontrados en las 500 cuentas son: $417,500 y $17,000 respectivamente. ^Cual 
es la probabilidad de que con dicha muestra se obtenga una media superior a $420,000? 

31. El jefe de un departamento de ventas sabe que en el almacen principal, el promedio de compra por 
cliente es de $112,000 con una desviacion estandar de $5,500. Si se toma una muestra de tamano 
36, ^cual es la probabilidad: 
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a) que la media de la muestra sea superior a $113,500. 

b) que sea superior a $113,200 e inferior a $111,500? 

32. Una fabrica produce correas cuyo diametro promedio es de 16 mm y desviacion tipica de 3,5 mm. 
Si se selecciona una muestra de 36 correas, ^cual es la probabilidad de que la media muestral sea 
menor o igual a 15,3 mm? 

33. Se sabe por experiencia que el rendimiento promedio por hectarea, en un cultivo, es de 70 bultos y la 
desviacion tipica de 20 bultos. Si se selecciona una muestra de 36 hectareas, ^cual es la probabilidad 
de que el rendimiento medio sea superior a 75 bultos? 

34. Las cajas de carton que contienen un determinado articulo producido por un establecimiento 
industrial tienen un peso medio de 300 kg , y una varianza d 2.500 kg 2 . ^Cual es la probabilidad de 
que 25 paquetes, tornados al azar y cargados en un camion de distribucion del producto, excedan la 
capacidad del camion, de 8.200 kg? 

35. Si la desviacion tipica de las estaturas de ninos de kinder es de 5 centimetros, ^cual es la probabilidad de 
que la estatura promedio de una muestra al azar de 100 ninos, difieran en mas de un centimetro? 

36. Si la desviacion tipica de las calificaciones de estadistica en el quinto semestre es de 8 decimas, 
^cual es la probabilidad, en una muestra de 20 estudiantes, de que la diferencia entre la media 
muestral y la poblacion sea mayor en 4 decimas? 

37. Un fabricante de bombillas dice que su producto tiene una media de duracion de 700 horas, con 
varianza de 14.400 horas. El dueno de un taller compro 144 bombillas de esta marca con la idea de 
comprar mas, si la duracion media de la muestra le resultara superior a 680 horas; ^que probabilidad 
hay de que el dueno del taller no vuelva a hacer compras de esa marca? 

38. Un distribuidor de botas especiales para el trabajo, garantiza al gerente de una empresa que el 
promedio de duracion de las botas es de 8,10 meses, con una desviacion tipica de dos meses y 
cinco dias. Si se decide la empresa a comprar 36 pares de botas, ^cual es la probabilidad, de que en 
promedio la duracion sea inferior a los 7 meses y quince dias? 

o o a a t o t a t o a a 

DISTRIBUCION MUESTRAL DE UNA PROPORCION p 

En el analisis de una caracterfstica cualitativa o atributo, se emplea la proportion de exitos y no el nume- 

ro de exitos como en la distribucion binomial. 

. . , ... Numero de casos favorables o exitos 

Anteriormente se defimo la proporcion de exitos como: p =-———-—- 

Total de casos posibles 

Ahora en vez de expresar la variable en terminos de exitos ( X) nos referiremos, al numero de ele- 

mentos con el atributo en la muestra (a) y lo dividimos por el tamano de la muestra (n). 
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Simbologia 

A= { Total de elementos que presentan la caracteristica investigada en la poblacion 


A=£A.=NP 


-p = p p- A _ XA Proporcion de elementos que presenta la caracteristica investigada 
p N N en la poblacion. 


Q = 


N-A 

N 


= 1 - P Proporcion de elementos que no presenta la caracteristica estudiada P + Q = 1 


Op = Varianza de la proporcion en la poblacion Op = PQ 


o _ = Desviacion estandar 


=4pq 


a p r 

V n 


PQ 


Error estandar de la proporcion 


Demostracion 


0p =PQ 


Variable: supongamos que se tiene una poblacion de 500 personas para analizar su peso en kilogramos 
XV _ 70+ 50+ 4 + 60 


Mx 


N 


500 


; porlotanto XV =70 + 50 + 48 + 60 + . 


<+ = y se tendra que: XV 2 = 70 2 + 50 2 + 48 2 + 60 2 +. 

Ya conocemos como se procede en el calculo de la // y de a 2 en la variable X; ahora, observemos 
como se debe calcular en el atributo. 


A tribute): Consideremos que se desea investigar la proporcion de mujeres en 500 personas de una 
poblacion; para ello se cuenta el numero de mujeres observadas. 

XV =1+1+1+1+1 =200 equivale a -+ XV 


^A 200 

P = /Ll p = n 1 = ^qq “ 0,40 ( Media proportional) equivale a /Li x 

Ahora si se requiere £A f =1+1+1+!= =X^, = NP t reemplazando se tiene que : 




-NP 2 NP-NP 2 NP1-P 


N 


N 


N 


= P 1 -P = PQ 


a 2 p - PQ lo cual queda demostrado. a p - *JPQ 

Variante estadistica. En muchos casos, podemos utilizar la distribution normal para evaluar la dis¬ 
tribution muestral de proporciones, siendo: 

Vale la pena obser- 
var la simbologia 
p que se utiliza para 
z la muestra 



o 
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2 a 

n 


o;=pq 
e p =JPQ 
s 2 p =pq 
S P =a [m 


(J r = 



= Proporcion muestral <^=> p 

= Proporcion poblacional <=> p p - P 

= Varianza de una proporcion en la poblacion 
= Desviacion proporcional en la poblacion 
= Varianza de una proporcion muestral 
= Desviacion tipica proporcional en la muestra 

= Error estandar en una proporcion 


Ejemplo 1. Se tiene que el 4% de las piezas producidas por cierta maquina es defectuosa, ^Cual es la 
probabilidad de que en un grupo de 200 piezas, el 3% mas sea defectuosa? 


fie a , 014 

p V n V 200 
a) Se desea determinar la ^> 0 , 03 ) = 

7 _P~Mp _ 0,03-0,04 _ at, 

fPQ~ 1 (0.04X0. 6) ~~ ’ 

\n V 200 

Z = -0,71-> A0,2612) 

P = 0,2612 + 0,5000 = 0,7612 



0,71 0 


^(/7 >o,o3 ) - 76,12 


b) Con correcdon. Si se quiere obtener una buena aproximacion a la distribucion normal, debe 
hacerse la correcdon en la variable discreta, siendo igual ^ . Si se va obtener una area hacia la 
derecha, se restara este factor de correcdon; en el caso de que sea a la izquierda, se sumara ese 
factor al valor de p. 



^ 0,03-0,0025 -0 f 04 
0,014 

Z = -0, —> A( 0,3133) 

P = 0,3133+ 0,5000= 0, 133 


0 , 0 


P(p> 0,03) _ 133 


c) Resolveremos el anterior problema mediante la distribucion normal 
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H = np = 200 0,04 = 

(7 = -Jnpq = -^200 0,04 0, 6 =2,77 

P (x>6)= Siend ° P x>5,5 = 

z = 5 ’ 5 ~ =-0, 0->A 0,315 
2,77 

/ > = 0,315 +0,5000 = 0, 15 p x>5 , 5 = 1,5 

Resultado bastante aproximado al obtenido en el punto (b) 

d) Podrfamos plantear y aun resolver el mismo problema aplicando la distribucion binomial. 
n- 200 p- 0,04 q = 0, 6 P( x > 6 ) = 

P = l- [Cg 00 0,04 0, 6 200 +C 200 0,04 5 0, 6 1 5 ] 


0,315 0,5000 



E jemplo 2. Se desea estudiar una muestra de 49 personas para saber la proporcion de las mayores de 40 
anos; sabiendo que la proporcion en la poblacion es 0,4. ^Cual es la probabilidad de que la proporcion 
en la muestra sea menor de 0,5? 


o 

n— 4 P — 0,4 ^(/? < 0 , 5 ) = 


z=P- p - 

0,5-0,4 

\PQ 

I (0,4X0,6) 

V n 

V 4 

7 _ 0,10 

0,10 

0,24 

Vo, 004 

\ 4 


Z = 1,43 -> A 0,4236 


P = 0,5000+ 0,4236 = 0, 236 


0,5000 0,4236 



0 1,43 


P p< 0,5 — 2,36 


Ejemplo 3. Cuarenta y seis por ciento de los sindicatos del pais estan en contra de comerciar con la 
China Continental; ^cual es la probabilidad de que una encuesta a 100 sindicatos muestre que mas del 
52% tenga la misma posicion? 


o 


P = 0,46 p = 0,52 fl = 100 

r 7 _ p~P _ 0,52-0,46 

[PQ I (0,46X0,54) 

V n V 100 


Z = 


0,06 

0,24 4 
100 


1,21 


P 


p> 0,52 _ 



0 1,21 


P 


p> 0,52 


Z =1,21 -+A 0,3 6 
P = 0, 5000-0,3 6 =0,1131 


= 11,31 
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EJERC 1C IQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lmea SIL. 

39. Se ha determinado que el 65% de los estudiantes universitarios de Medellin prefieren los cuademos 
marca Profesional. ^Cual es la probabilidad de que en un muestra de 100 universitarios de dicha 
ciudad, encontremos que: 

a) como maximo el 68% sean usuarios de ese tipo de cuademo. 

b) exactamente 66% sean usuarios (utilizar medio punto de porcentaje para los limites)? 

40. Un fabricante de desodorantes recibe cada semana lotes de 10.000 valvulas para los tarros rociadores. 
Para aceptar o rechazar dichos lotes, selecciona al azar 400 valvulas de cada lote; si el 2% o mas 
resultan defectuosos, se rechaza el lote. En caso contrario se acepta el lote. ^Cual es la probabilidad 
de rechazar un lote que contenga el 1% de valvulas defectuosas? 

41. Se ha encontrado que el 4% de las piezas producidas por cierta maquina son defectuosas. ^Cual es la 

probabilidad, al seleccionar 400 piezas, que el 5% o mas sean defectuosas? 

42. Para elegir presidente de un sindicato, un candidato obtuvo el 46% de los votos. Determinar la 
probabilidad de que entre 200, elegidos al azar, de un total de 1.000 afiliados, se obtenga la mayoria 
de votos para dicho candidato. 

43. En cierta facultad de una universidad de Caracas 1/6 de los alumnos son mujeres. Si se extrae una 
muestra aleatoria de 200 estudiantes de la facultad, ^cual es la probabilidad de que el 20% o mas 
sean mujeres? 

44. Hallar la probabilidad de que en 200 lanzamientos de una moneda, el numero de caras este 
comprendido entre el 40% y 60%. 

(En el SIL se ha dejado planteado como distribucion binomial y se ha resuelto mediante la distribucion 
normal y de proporciones). 

45. Se sabe que el 25% de los estudiantes de un colegio usan anteojos. ^Cual es la probabilidad de que 
8 o menos usen anteojos en una muestra de 36 estudiantes? 

46. Un nuevo tratamiento con rayo laser asegura su eficacia en el 90% de los casos. Si se selecciona una 
muestra de 40 enfermos, i que probabilidad hay de que se presente una diferencia mayor del 8% en 
cuanto a su eficacia? 

47. Segun datos anteriores, se sabe que la efectividad de una vacuna es del 90%. ^Cual es la probabilidad 
de que al vacunar a 64 personas la proporcion sea mayor del 95%? 

48. Se ha demostrado, por reclamos que han hecho, que el 20% de las encomiendas llegan averiadas 
al utilizar una compania de transporte intermunicipal. ^Cual es la probabilidad, al enviar 100 
encomiendas, de que la proporcion sea menor de 25%? 

49. Por datos obtenidos con anterioridad, se sabe que el 70% de las familias que tienen telefono no se 
encuentran en las horas de la tarde del dia domingo. Se toma una muestra aleatoria de 36 familias 
del directorio telefonico y se les llama. ^Cual es la probabilidad de que el 50% o mas esten ausentes? 
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50. Se sabe que el 7% de los ninos que nacen en cierta region, mueren antes de alcanzar un mes de vida. 
Si durante un cierto periodo de tiempo nacieron 40 ninos, ^cual es la probabilidad de que 6 o mas 
de ellos mueran antes de alcanzar el primer mes de vida? 

51. Segun registros del Departamento de Circulacion y Transito, el 25% de los heridos en accidentes 
de transito quedan con alguna incapacidad de por vida. En un mes cualquiera se registran 150 
personas que sufrieron lesiones. ^Cual es la probabilidad de que 42 o mas victimas queden con 
alguna incapacidad? 

52. 1/3 de los alumnos matriculados en las facultades de publicidad son hombres. Se extrae una muestra 
aleatoria de 150 alumnos matriculados en dichas facultades, ^cual es la probabilidad de que 40 o 
menos sean de sexo masculino? 

53. Se toma una muestra aleatoria de 200 unidades producidas en una hora por un maquina. Se sabe 
que el 10% de las unidades producidas son defectuosas. ^Cual es la probabilidad de que 16 o menos 
resulten defectuosas? 

54. Se sabe que el 70% de los empleados publicos usan corbata; ^cual es la probabilidad de que, al 
seleccionar 64 empleados, menos del 56% no usen la corbata? 

55. Si se realiza una investigacion entre 36 personas, sobre la preferencia en el uso de desodorante en 
barra y en atomizador, ^cual es la probabilidad de que el 82% mas de las personas entrevistadas 
prefieran el desodorante en barra? Se sabe por experiencia que dicha proporcion es del 74% y 26%, 
respectivamente. 

56. En cierto proceso de produccion se utiliza la siguiente regia de decision: se elige una muestra al azar 
de 36 piezas; si el porcentaje de piezas defectuosas de la muestra excede de p, se detiene el proceso 
para localizar las fallas. Si se sabe que el proceso ocasiona un 10% de piezas defectuosas, en 
promedio, determine el valor de p, para que exista un 22,5% de probabilidad de detener el proceso, 
cuando la proporcion de piezas defectuosas exceda de p. 

57. Se sabe que el 65% de los estudiantes de primaria, en una concentracion escolar, son nacidos 
en esa misma ciudad. ^Cual es la probabilidad de que en una muestra de 100 estudiantes de esa 
concentracion, cuando menos el 68 % sean oriundos de esa ciudad? 

58. Un fabricante de insecticidas domesticos recibe cada semana lotes de 10.000 valvulas para los tarros 

rociadores. Para aceptar o rechazar dichos lotes, ha establecido el siguiente procedimiento de 
muestreo: selecciona al azar 400 valvulas de cada lote; si el 20% o mas resultan defectuosas, rechaza 
el lote. En caso contrario lo acepta. /,Cual es la probabilidad de rechazar un lote que contenga el 
15% de valvulas defectuosas? 

59. Si se toma una muestra aleatoria de 80 articulos producidos por una maquina, sabiendo que el 15% 
resulta defectuoso, ^cual es la probabilidad de que el 20% o mas de los articulos observados en la 
muestra sean defectuosos? 

60. En una eleccion departamental o provincial, el 55% de los electores estan a favor del candidato del 
partido A, ^cual es la probabilidad de que, en una muestra de 100 electores, el resultado no muestre 
una mayoria a favor del candidato? 
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61. Se sabe que el 40% de las familias, en uno de los barrios al norte de la ciudad, tiene aparatos 
receptores de television a color. Si se toma una muestra aleatoria de 50 familias, ^cual es la 
probabilidad de que haya 25% o mas familias con dicha clase de receptores? 

62. Se sabe que el 70% de la poblacion economica activa del pais tiene ingreso mensual menor de 
$1,900,000. Si se toma una muestra de 1.000 personas de tal poblacion, encontrar la probabilidad 
de que entre 680 y 730 tengan ingresos menores de $1,900,000. 

63. El gerente de un supermercado considera que de un total de 50 clientes que realizan compras 
a mediodia, 7 incluyen leche en su compra; efectua una muestra de 100 clientes. ^Cual es la 
probabilidad de que menos de 12 clientes compre leche a mediodia? 

64. En cierto proceso de produccion se utiliza el siguiente sistema de control de calidad: se elige 
una muestra de 36 unidades; si el porcentaje de unidades de la muestra no excede el valor de p, 
se continua el proceso. Si se sabe que el proceso ocasiona un 10% de unidades defectuosas, en 
promedio, determine el valor de p, para que exista un 6 2% de probabilidad de continuar el proceso, 
cuando la proporcion de piezas defectuosas es inferior a p. 

65. El jefe de bodega de una cadena de almacenes, recibe semanalmente 15.000 unidades de un 
determinado articulo, que debe ser examinado para su aceptacion. El tiempo disponible para esta 
revision es pequeno dado el volumen de articulos, por lo cual se considero necesario la seleccion al 
azar de 300 articulos, con la recomendacion de que si 15 o mas de ellos no estan en buen estado, se 
devuelve la mercancia. ^Cual es la probabilidad de devolver las 15.000 unidades, si sabemos 

que el 3% de los articulos se consideran en mal estado? 

66 . Se toma una muestra aleatoria de 200 unidades producidas en una hora por un maquina. Se sabe que 
el 10 % de las unidades producidas son defectuosas. ^Cual es la probabilidad de que en la muestra 
tomada, 16 o mas articulos, resulten defectuosos? 

67. Un laboratorio lanza una nueva droga al mercado. Se asegura que en el 80% de los casos la droga 

es eficaz. Si en una clinica se seleccionan 49 pacientes que padecen de la misma enfermedad, 
^,que probabilidad hay de que se presente una diferencia superior al 10%, a lo asegurado por el 
laboratorio? 

o o a a t o t a t o a a 

DISTRIBUCION DE DIFERENCIAS ENTRE DOS M EDIAS MUESTRALES X - f 

Se tiene dos poblaciones normales e independientes, identificadas la primer por X y la segunda por Y, 

de tamanos N 1 y N 2 , cuyas medias se simbolizan por ju x y ju^y sus desviaciones tipicas por O x y cr y . Se 

obtiene un numero (M) de pares de muestras posibles. Las medias muestrales de la primera poblacion se 

identifican por: 

X, x 2 x 3 . x M y las muestras de la segunda variable por y x y 2 y 3 y M 

Las desviaciones tipicas muestrales respectivas seran: s Xi s X2 s x ^ s x ^ y 
s , s. s. s. , 

>1 >2 >3 >,\/ ? 
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Ahora, si consideramos las diferencias para cada par, la media aritmetica de dichas diferencias se 
simbolizara por U-- donde: 

x-y 


= 


I fo - y ,) _ fa - y \)+ fa - x 2 )+ + fa/ ~ y M ) 


M 


M 


Mx-y = 


l x , I y r 


M 


M 


Se puede demostrar que la media de las diferencias de todos los pares de medias muestrales posi- 
bles, es igual a la diferencia entre las medias poblacionales. 


tk->=Vx 1 My 




La desviacion tipica de las diferencias entre los pares de medias muestrales se simboliza por: O- 


y se calcula mediante la formula: 


x-y 




Zlfa-x,)- m x - 




M 


La desviacion tipica de las diferencias entre los pares de medias muestrales, denominada tambien 
como error estandar de las diferencias entre las medias muestrales, es igual a: 


siendo: 


2 & x 
oi = —^ L 


r 2_fa 


Oj-y=i°l+°-y 



Suponiendo que la distribucion de diferencias entre las medias muestrales tenga un comportamiento 
similar a la distribucion normal, la variante estadistica estara dada por la formula: 


Z = 


( x - y)~ Mx-j 


■ _fa X 2 ) Ml A 2 


G x-y 


K + — 

' m n~) 
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Tambien se pueden presentar por una de las siguientes formas: 

(*- 30 - Mx-My 


z = 


( X ~y)~ Mr~My 


z =- 






Utilizamos la distribucion normal como una aproximacion, para resolver problemas de distribucio- 
nes de diferencias entre dos medias muestrales. 


M x 

My 



n \ 

n 2 

X 

y 


Z = 


(x-y)-(ju x -ju.) 


r i 

I ^ Mi 


L _ _ J 


Se puede aplicar esta distribucion cuando no se conocen las varianzas poblacionales las cuales 
pueden ser sustituidas por varianzas muestrales siempre que sean mayores de 30. Hay autores que con- 


sideran su utilizacion si n ] + r? 2 > 30. Siendo su formula: 


Z = 


(x-y)- n x ~M> 


1 2 

2 

I- 


V 

n? 



E jemplo 1. Se tienen dos poblaciones normales e independientes, donde la media de la segunda poblacion 
es 0,65 menor que la de la primera; si se seleccionan muestras de tamano 100 y 120 y si las respectivas 
desviaciones tipicas poblacionales son 12 y 8 , se pide determinar la probabilidad de que, en un par de 
muestras, la diferencia entre ambas medias muestrales sea superior a 1 en valor absoluto. 


o 

: M x 

~My 

= 0,65 

n x =100 

n 2 =120 

Ox =12 

00 

II 

O 


r 

-Mi 

= 0,65 

n x - 100 

n 2 = 120 

Oj =12 

o 2 =8 




0,0987 



Z =-—q 25 
1,40 ’ 

Z = 0,25 -^A(0,0987) 

P = l- [0,0987 + 0,3810] 

P ( ___ >W) = 1 - (0,4797) = 0,5203 = 52,03% 


7 _ 1 0,65_ 11 q 

Z -L40- “ U8 

Z =-1,18->,4(0,3810) 
^r 52 - 03% 
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Ejemplo 2. Se obtiene una muestra aleatoria de 100 elementos de una poblacion normal, que tiene 
media 50 y desviacion estandar 8 . Luego se selecciona otra muestra aleatoria de 400 elementos de una 
poblacion normal, que tiene media 40 desviacion estandar 12. Encontrar la probabilidad de que: 

a) la media de la primera muestra exceda a la de la segunda en 8 o mas. 

b) ambas medias difieran, en valor absoluto, en 12 o mas. 


r\ =100 

«^ = 400 

74 = 50 

o 

II 

II 

00 

a= 12 

y 

= 100 

n 2 = 400 

/4 = 50 

Pi =40 

o i = 8 

°2 ~ 12 , 


p 

r (x-y> 8) 


= ? 


z = 


(x-y)-(fi x -fi ) 8-(50-40) 


- + - 


64 144 

100 400 


Z = -2 -+ Z(0,4772) 6 Z(0,4773) 
P(x-y>8) = 0,5000 + 0,4772 
P (I -- y > 8 ) =0,9772 = 97,72% 


= -2 


0,4772 0,5000 



b) ^x-y>\\2\ 

z = 12-10 = 2 

Z = 2 -+ A 0,4772 

P(*-y> |i 2 |) = !- 0,4772 + 0,5000 =0,0228 


Z= 10 =-22 

Z = -22 -^A 0,5000 

P(x-y> -12)= 0,5000 -0,5000 =0 

P ix-v>\n\r °’ 022 0 = 0,022 = 2,2 



P 

(7C—>>| 121) 


= 2,2 


E j emplo 3. En un restaurante, el consumo medio por desayuno es de $4,980, con una desviacion estandar 
de $950. En un segundo restaurante las correspondientes cifras son $4,238 y $820. Si se eligen al azar 80 
boletas de pago del primer restaurante y una muestra aleatoria de 60 del segundo, ^cual es la probabilidad 
de que la diferencia entre los consumos medios de ambas muestras sea mayor que $ 1,000 en valor 
absoluto? 



= 4 

0 

Py 

= 4 23 

o x = 50 

o= 20 

o 

\o 

II 

<N 

R 

O 

II 

sT 

z 

= 4 

0 

Pi 

= 4 23 

o, = 50 

o 2 = 20 

n x = 0 n 2 = 60 



























































CAP ITU LO SIETE 

DISTRIBUCIONES MUESTRALES 


297 


Solution: p (x-y>\i ooo|) “ p x ~ p y ~ 4 0 - 4 23 - 742 


Z = 


1 000-742 


02 500 i 627 400 


60 


Z = , = = = 1,75 
V21 737, 2 

-1 000-742 


Vl 1 2 1,25 + 10 546,67 


-1 742 
V21 737, 2 


- 11 , 2 



11, 2 0 1,75 


^(x->>|l 000|) ^,01 


Z = 1,75 -+ Z 0,45 Z = -11, 2 -+ A 0,5000 
A= 0,5000 + 0,45 =0, 5 

P = 1 - 0, 5 =0,0401= 4,01 

Ejemplo 4. Dos marcas, A y B de tabletas antiacidas efervescentes registran el mismo promedio de 
disolucion en agua, con desviacion estandar de 12 segundos para la marca A y 24 segundos para B. 
Suponiendo que el tiempo de disolucion este normalmente distribuido, ^cual es la probabilidad de 
que, con una muestra de 36 tabletas de cada marca, las tabletas B registren un promedio de tiempo de 
disolucion, cuando menos 5 segundos mas rapido que A? 

0 ; jU x =M y G x ~12 o y = 24 n x = 36 =36 P^- y>5 ) = 


Z = 


6 ‘-y)~ t 1 , - u,) 


n \ n 2 


z = 


5- 0 


= 1,12 


144 576 V4 + 16 

"36" 36" 


Z = 1,12 -^A 0,36 6 
P = 0,5000 -0,36 6 = 0,1314 

E| ERCICIOS PARA RESOLVER 



+--j> 5 ) = 0,1314 = 13,14 


x—y 

z 





La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Stema de I nfor mad on 
en Linea SI L. 


68 . De cada una de dos poblaciones normales e independientes con iguales medias desviaciones 
estandar de 6,40 y 7,20, se extraen muestras de 64 elementos. Encontrar la probabilidad de que la 
diferencia entre las medias de las muestras exceda de 0,60 en valor absoluto. 

69. El rendimiento medio de los autos de la marca A es de 20 kilometros por galon de gasolina, con 
una desviacion estandar de 6 k.p.g. Las cifras comparables para los autos B son 25 y 5,5 k.p.g. Se 
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supone que el rendimiento de cada una de ambas marcas esta normalmente distribuido. ^Cual es la 
probabilidad de que en un concurso, el rendimiento medio para 10 autos de la marca A sea mayor 
que el de 9 autos de la marca B? 

70. En promedio, los estudiantes de la Universidad A se levantan 50 minutos despues de la salida del 
sol, con una desviacion estandar de 15 minutos. Los estudiantes de la Universidad B se levantan 
60 minutos despues de la salida del sol, con una desviacion estandar de 18 minutos. Un grupo de 
25 estudiantes de la Universidad A realiza un viaje junto con 20 alumnos de la B. Encontrar la 
probabilidad de que la hora media de levantada del grupo de la Universidad B sea mas temprana 
que la del grupo de la Universidad A. 

71. A y B fabrican dos tipos de cables, con una resistencia media a la rotura de 4.000 y 4.300 libras, 
con desviaciones tipicas de 980 y 850 libras, respectivamente. Si se prueban 70 cables de A y 40 
cables de B, ^cual es la probabilidad de que la media de resistencia a la rotura de A sea, al menos, 
300 libras mas que B? 

72. El sueldo mensual de los licenciados en educacion en Bogota es de $920,000 como promedio, con 
una desviacion estandar de $31,500. En la misma ciudad, el salario mensual de los economistas en 
la administracion publica es de $925,000, con una desviacion estandar de $52,500. Se toma una 
muestra aleatoria de 100 de cada poblacion. ^Cual es la probabilidad de que la diferencia en las 
asignaciones B sea superior a las de A en $12,510? 

73. Dos fabricas A y B, productoras de bombillas afirman que el promedio de duracion de ellas es de 
1.500 y 1.450 horas, respectivamente, con desviaciones tipicas de 90 y 100 horas. Si se compran 
100 bombillas de cada fabrica, ^cual es le probabilidad de que la diferencia en duracion entre las 
dos marcas sea mayor de 40 horas? 

74. Dos marcas de bombillas de alumbrado publico, A y B tienen una duracion promedio de 1.400 y 
1.200 horas, respectivamente, y sus varianzas de 40.000 y 10.000 horas. Se extrae una muestra 
aleatoria de 125 por cada marca. Determine la probabilidad de que: 

a) La marca A tenga una vida media de por lo menos 160 horas mas que B. 

b) La marca A tenga una vida media de por lo menos 250 horas mas que B. 

75. El tiempo promedio requerido para ejecutar un trabajo de ensamblaje es de 2 horas, con una desviacion 
tipica de 40 minutos y, el tiempo requerido para ejecutar otro trabajo o etapa en el ensamblaje es 
de una hora con cuarenta minutos, con una desviacion tipica de 32 minutos. Suponiendo que se 
distribuyen normalmente, ^que porcentaje de veces sera mayor el promedio del primer trabajo con 
relacion al segundo, si se toman muestras de tamano 28 y 30 respectivamente? 

76. Dada la siguiente informacion acerca de las vidas utiles de dos marcas de pilas de 9 voltios Marca 
A (horas): media = 51; Desviacion tipica = 8; Marca B (horas): media = 50; desviacion tipica = 6. 
Si se selecciona una muestra aleatoria de 100 pilas de cada marca: 

a) ^cual es la probabilidad de que la vida util media de la marca A sea superior a de la marca B en 
0,6 horas o mas. 

b) Sea inferior a la de la marca B en 0,6 horas o mas. 

77. Por experiencia se sabe que el tiempo de trabajo promedio en un articulo con los tornos existentes 
es de 38,6 minutos (desviacion tipica de 13,8). El tiempo de trabajo promedio con los nuevos tornos 
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es de 35,5 minutos, (desviacion tipica 14,1). Si se toman dos muestras de 18 tomos cada una. ual 
es la probabilidad, al producir 900 articulos, que el promedio de diferencia de B con respecto a A, 
sea superior en dos minutos? 

78. El tiempo promedio requerido para ejecutar un determinado trabajo es de 2 horas, mientras que para 
otro trabajo, otro grupo de trabajadores, gasta una hora cuarenta y cinco minutos. Se sabe que la 
desviacion estandar para cada uno de estos trabajos es de 30 y 20 minutos respectivamente. ^Cual es 
la probabilidad, si se toman dos muestras de 30 trabajadores cada una, de que el promedio requerido 
para ejecutar el segundo trabajo sea mayor que el primero? 

79. El promedio de los obreros, en una fabrica textil, es de 34 anos con desviacion estandar de 6 anos, 
ademas, el promedio de edad de las obreras es de 30 anos con desviacion estandar de 4 anos. /,Cual 
es la probabilidad, al tomar muestras de 20 obreros de cada sexo, de que el promedio de edad de las 
mujeres resulte mayor que el de los hombres? 

80. Cierto artefacto electrico tiene una vida promedio de 2.600 horas, con desviacion tipica de 200 
horas; mientras que el mismo artefacto de fabrication extranjera tiene un promedio de duration 
de 2.400 horas, con desviacion estandar de 180 horas. Si se toman dos muestras de 125 y 100 
artefactos, respectivamente, ^cual es la probabilidad de que la diferencia registrada entre las dos 
muestras sea superior en 150 horas? 

81. Se sabe que los pesos de ciertas bolsitas aromaticas tienen una media de 25 gramos, con desviacion 
tipica de 5 gramos. Si se toman dos muestras de 100 bolsitas cada una, ^cual es la posibilidad de 
que los resultados de estas muestras difieran en mas de 2 gramos? 

o o a a t o t a t o a a 

DISTRIBUCION DE Dl FERENC IAS ENTRE DOSPROPORCIONESMUESTRALES P 2 -P 2 

En el caso de dos poblaciones independientes, de tamano l\l l y A/ 2 , distribuidas binomialmente, con 
parametros, medias proportionates P T y P 7 (tambien se le pue den represent ar las m edias por/i pi y ju p2 y 
desviaciones proporcionales o pi y cr p 2 siendo: <J p] - ^Jp [ Q x y a pi - ^P 2 Q 2 . El error estandar de las 
diferencias entre las dos medias proporcionales estara dada por o pi _ P2 siendo: 

_ I?:1 Qi A Qi 

(J Pi-p 2 ~ v~n - f ^— Cuando se trabaja con parametros o valores poblacionales 

Las proporciones P l y P 2 son poblacionales, y se simbolizan con letras mayusculas. Luego cuando 
son muestrales, se utilizan letras minusculas p i y p 2 . 

Cuando n i y n 2 corresponden a muestras grandes, es decir, ambas superiores a 30, se tendra, que el 
error estandar de las diferencias entre dos proporciones es: 

[Pi9i P 2 Q 2 
S P<-P 2 ~-y n t + n 2 


La medid de /as diferencias entre dos medias proporcionales, se simboliza; indistintamente por: 

Pp-Pp 2 =Pp-Pp 2 = p -P 2 
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La variante estadistica Z, estara dada en la misma forma que fue presentada para diferencias entre 
dos medias muestrales: 


Z = 


(P\ ~ p 2 )~ (// /;| ~// p J 

[KK^KK 


En este Capitulo, en todos los ejercicios de proporciones se trabajara con P } y P 2 (mayusculas), 
en vez de p i y p 2 aunque las muestras sean pequenas, menores de 30, cuando se calcula el error estandar 
proporcional. 



Ejemplo 1. Consideremos dos maquinas que producen un determinado articulo; la primera produce 
por termino medio un 14% de articulos defectuosos, en tanto que otra, produce el 20% de articulos 
defectuosos; si se obtienen muestras de 200 unidades en la primera y 100 unidades en la segunda, ^cual 
es la probabilidad de que difiera A de B en 8% o mas? 


o 


L-P 2 ^0,0 — 

= 200 

._(Pi-P 2 )-(^ fl -M P J 

1* i a + 

Pi Qi 

V 

n 2 

0,0 - ■ 

-0,06 

0,14 0, 6 

, 0,2 0, 

V 200 

100 


n 2 = 100 


0,14 

0,047 


= 2 , 


Z = 2, -> A 0,4 6 


P l =14 P 2 = 20 



0 2 , 


P Pl -P 2 > 0,0 =0,5000-0,4 6 
P n -p 2 > 0,0 =0,0014 = 0,14 


P 


P 1 -P 2 > 0,0 


= 0,14 


Ejemplo 2. Dos fabricas A y B, producen articulos similares. La produccion de A contiene 7% de 
defectuosos, y la de B contiene, 5%. Si se extrae una muestra aleatoria de 2.000 de cada una de las 
producciones de las fabricas, ^cual es la probabilidad de que las dos muestras revelen una diferencia en 
el numero de los defectuosos del 1% o mas? 


o 


P A = 0,07 P B = 0,05 n i = 2 000 


n 2 =2 000 


P (P 1 -P 2 >|0,01|) 


2 — (Pl Pl ) (^l ^2 ) 

jp 1 Qi + Pi Qi 

v n l n 2 


z = 


0,01-0,02 

0,07 0, 3 0,05 0, 5 

2 000 + 2 000 


0,40 2 0,5000 



-4 1,33 0 
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- 0,01 

0,0075 


-1,33 


P = 0,5000+0,40 2 = 0, 0 2 


v _ 0,01 0,02 _ . ^(/j-/',>o.o i) ^ 

0,0075 

Z = -1,33 A (0,40 2) 

Z = -4 —> A (0,5000) 


E jemplo 3. Se sabe que cierta marca de crema para las manos satisface e 65% del mercado. < Cual es la 
probabilidad de que dos muestras aleatorias de 200 usuarios cada una, muestre una diferencia mayor del 
10 % en las proporciones de uso de la crema? 

o : P l —P 2 =0 ^-^> 10 , 101 )= P i = 0,65 P 2 =0,65 



Z = 


0 , 10-0 


0,65 0,35 0,65 0,35 


= 2,1 


200 


200 


- 0 , 10-0 = - 0,10 

0,0477 0,0477 


Z = 2,1 ->A 0,4 21 
Z = -2,1 —» A (0,4 21) 


A =0,4 21 + 0,4 21 = 0, 642 
^-^> 10 . 101 )= 1,0000-0, 642 = 0,035 

P {pi-r-2>\ o.io|) = 3 ’ 5 


Ejemplo 4. Suponga que una maquina A produce, por termino medio, un 12% de piezas defectuosas, 
en tanto que la maquina B, el 18% de piezas con defectos. Se desea hallar la probabilidad de que el 
promedio de defectuosas de una muestra de 600 unidades, tomada de la maquina A, no difiera en mas de 
un 8 % de otra muestra de 400 unidades, de la maquina B. 


o 


: />= 0,12 P 2 =0,18 «, = 600 


n 2 = 400 


>i-ft<| 0 , 08 |) : 


r,_ iPl-P2)-{ P l- P 2) 

j P l 01 + P 2 02 

y n x n 2 


Z = 


0,0 - -0,06 


0,12 0 , 


0,1 0 , 2 


0,3051 0,5000 



600 


400 
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o 

£ 

II 

o\ 


0,0233 


-0,0 

- -0,06 

1 0,12 0, 

0,1 0, 2 

\ 600 

400 


- 0,02 

0,0233 


=-o, 


6 


Z = 6 -» A 0,5000 
Z = -0, 6^^(0,3051) 

P, . ., =0,5000 + 0,3051 = 0, 051 

(a-M°.o I) 

P (pi-F2< | 0 , 0 |) = °’ 51 


Ejemplo 5. Ciertas encuestas a televidentes, revelan que el 25% de los hombres y 33% de las mujeres 
de clase media, ven la telenovela de las 11 y 1/2 de la manana. ^Cual es la probabilidad de que en 
dos muestras aleatorias de 150 hombres y 100 mujeres respectivamente, pertenecientes a dicho estrato 
social, se encuentre que la proporcion de hombres que han visto el programa sea igual o mayor que la 
proporcion de mujeres? 


o 


75=0,25 P 2 = 0,33 n x =150 ^ 2 =100 p (p,-p 2 >o) : 

0- 0,25-0,33 


Z = 


0,25 0,75 0,33 0,67 


150 


100 


0,0 


0,05 3 


-1,36 


Z = 1,36 ->A 0,4131 

P{p x -p 2 >o) - 0,5000 - 0,4131 = 0,0 6 


0,4131 



0 1,36 


P (p ] -p 2 >o) _ ^,6 


EJ ERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Sterna del nfor mad on 
en Linea SI L. 

82. Ciertas encuestas realizadas en una ciudad de la costa, revelan que el 25% de los hombres y el 33% 
de las mujeres escuchan cierto programa radial. ^Cual es la probabilidad de que en dos muestras 
de 150 hombres y 100 mujeres respectivamente, domiciliados en dicha ciudad, se encuentre que la 
proporcion de mujeres que escuchan el programa sea menor o igual a la proporcion de hombres? 

83. En dos fabricas Ay B, que producen camisas parahombre, se sabe que ell7%yl5%de laproduccion 
es defectuosa. Si se extrae una muestra de 200 camisas de cada lote producido en las fabricas, ^Cual 
es la probabilidad de que las dos muestras revelen una diferencia superior al 3%? 

84. Se sabe que cierta marca de dentifrico satisface el 65% del mercado. ^Cual es la probabilidad de 
que dos muestras aleatorias de 200 usuarios cada una, revele una diferencia mayor del 10% en las 
proporciones del uso del dentifrico? 
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85. Ciertas encuestas sobre un programa de television revelan que el 28% de los hombres y el 38% 
de las mujeres de clase media, ven dicho programa. ^Cual es la probabilidad de que en dos 
muestras aleatorias de 150 hombres y 100 mujeres respectivamente, pertenecientes a dicho estrato, 
se encuentre que la proporcion de hombres que han visto el programa sea igual o mayor que la 
proporcion de mujeres? 

86 . Se sabe que cierto producto satisface el 72% del mercado. Seleccionamos dos muestras 
(independientes) de la misma poblacion, de tamano 150 cada una. ^Hallar la probabilidad de que 
revelen una diferencia: 

a) mayor del 6%. 

b) en la segunda muestra la diferencia sea superior en un 5%? 

87. El 12% de la produccion de una maquina es defectuosa, mientras que en otra similar es del 15%. Si 
se extraen dos muestras de tamanos 80 y 100 respectivamente, ^Cual es la probabilidad (en cuanto 
al porcentaje de defectuosos): 

a) que las dos muestras revelen una diferencia superior al 3%. 

b) que el porcentaje en la muestra A, sea superior a la de B? 

88 . Es sabido que los porcentajes de familias con ingreso superior a $570,000 en las ciudades A y B 
es de 25% y 20%, respectivamente. Se seleccionan al azar dos muestras de 100 familias en cada 
una de las dos ciudades y se comparan las proporciones muestrales de las familias con ingreso 
superior a $570,000. ^Cual es la probabilidad de que la proporcion muestral correspondiente a la 
ciudad B sea: 

a) mayor que la de A en 3% o mas. b) menor que la de A en 3% o mas? 

89. En una agenda de empleo se sabe que por cada 100 personas que lo solicitan, 50, ademas de ser 
bachilleres, tienen alguna experiencia sobre el trabajo a desarrollar. Se extraen 2 muestras de la 
misma poblacion, en forma independiente, de tamano 36 cada una. ^Cual es la probabilidad de que 
las dos muestras difieran en 8 o mas personas que tengan alguna experiencia sobre el trabajo? 

90. En dos fabricas A y B, que producen determinados articulos para hombre; se sabe que el 8 y 12% de 
la produccion es defectuosa. Si se extrae una muestra de 400 articulos de cada lote producido, en cada 
fabrica, cual es la probabilidad de que las dos muestras revelen una diferencia inferior al 3%? 

o o a a t o t a t o a a 


TAMANO DE LA MUESTRA 


Hasta ahora, se ha venido considerando el tamano (fl) de la muestra conocido, pero para determinarlo, 
es necesario identificar los siguientes componentes o elementos tecnicos. 


La varianza (cr 2 ). Corresponde al grado de variabilidad que presentan las unidades de la pobla¬ 
cion. Mientras mas grande sea d 1 mayor sera el tamano de la muestra. El valor de cr 2 supues- 
tamente conocido, de lo contrario se debe estimar a traves de una investigacion preliminar. En 
el caso de cr 2 = PQ, sucede algo similar, pero se tiene la costumbre de tomar P = 0,50 con lo 
cual se obtiene el maximo valor posible de fl. 
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Nivel de confianza. Tiene relacion directa con el tamano de la muestra, por lo tanto se dira que 
a mayor nivel de confianza mas grande debe ser el tamano de la muestra. Los valores de Z se 
obtienen mediante el uso de tablas tal como se ha venido haciendo. El nivel de significacion es 
fijado por el investigador, de acuerdo con su experiencia. 

Precision de Id estimacidn. Corresponde al margen de error que el investigador fija de acuerdo 
con el conocimiento que tenga acerca del parametro que piensa estimar. Se le conoce como 
error de muestreo (E), siendo: 


E = Z 




E-Z- 


N-n 


V^v^v-i 


Recursos humanos, financieros y tiempo , no entran dentro de la determinacion tecnica del tamano 
de la muestra, pero es de suma importancia al establecer el tamano de las investigaciones. 


C alculo de en poblaciones infinitas 


La formula para calcular el tamano optimo en el muestreo aleatorio simple, en una poblacion infinita se 
obtiene asi: 


Z = 


X — JU 

a 4n 


-> 


E-x-ji 


Error = —> 

dn 


de donde 


4n 


Zo_ 

E 


Siendo: 


(En la variable) 


(En la proporcion) 


n = 


z 2 pq 


E j emplo 1. El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio de compra por 
cuenta, baja de cierto nivel. El gerente de un gran almacen por departamentos desea estimar el promedio 
de lo comprado mensualmente por los clientes que usan la cuenta de credito, con un error de $2,500, y 
una probabilidad aproximada de 0,95. ^Cuantas cuentas debera seleccionar, si sabe que la desviacion 
estandar es de $30,000, la cual fue obtenida de los balances mensuales de las cuentas de credito? 

o 

n = (Z°) 2 = ± - 300002 = 553,1 =554 n = 554cuentas 

{ E J 2 500 2 

Nota: siempreel resultado obtenido se redondea al n mero superior, por peque a que sea la fraccion. 


E j emplo 2. Un auditor desea tener un nivel de confianza del 95%, para que la verdadera proporcion de 
error no exceda del 2%. Si la poblacion es muy grande, ^que tamano tendra la muestra que va a tomarse, 
si el auditor estima que la proporcion de error es del 5%? 


_Z 2 PQ_ l 6 2 0,05 0, 5 
E 2 0,02 2 


= 456,1 =457 cuentas 


n - 457 cuentas 
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E jemplo 3. De una remesa, de la cual se tomo una muestra de 200 articulos, se encontro que 20 de ellos 
eran defectuosos. Con una confianza del 95%, calcular el error de la muestra. 


Z^PQ 

E 2 

20 


E , = ^PQ 


P _ 200 _0,10 


E = 



6 . 


0,10 0 , 0 

200 


= 0,04157 


E = 4,16 


E j emplo 4. Una firma constructora desea estimar la resistencia promedio de las barras de acero utilizadas 
en la construccion de edificios de apartamentos. ^Que tamano de muestra se requiere para garantizar que 
habra un riesgo de solo 0,001 de sobrepasar un error de 5 kg. o mas en la estimation? La desviacion 
estandar de la resistencia de este tipo de barras se estima en 50 libras. 


o 

P = 1-0,001 = 0, 

P = ^Y~ = 0,4 5 }—> Z = 3,27 


3,27 2 (2.500) 
10 2 


= 267,32 = 268 


E = 5 Kg = 10 libras 
<7 = S = 50 libras 
a 2 - s 1 - 2.500 libras 2 
n = 268 barras 


E j emplo 5. En un dia, la production de tarjetas perforadas por una persona se encuentra en una gaveta. 
Se desea estimar el porcentaje de tarjetas que tiene al menos un error, mediante una muestra aleatoria 
simple. ^Que tamano de muestra es necesario si se piensa que el porcentaje esta entre el 4 y 8%? Se 
acepta un error estandar del 3% y confianza del 95%. 


o 


Z 2 PQ _ l 6 2 0,0 0, 2 
E 2 ~ 0,0^ 


= 314,15= 315 


n = 315 tarjetas 


En este caso se toma el valor de P mas cercano a 0,50. Tambien se puede tomar el promedio, es decir 
-4— = 6 por lo tanto el tamano n sera: 


p = 4. 


1 6 2 0,06 0, 4 
0,03 2 


240,74= 241 tarjetas 


n - 241 tarjetas 


Ejemplo 6. ^Que tamano de muestra es necesario, si se considera una confianza del 90% para la 
proporcion de la poblacion, y el error es del 8%? 


n = 


164 2 0,50 0,50 

0,0 2 


= 105,06= 106 


n= 106 


=> Observe que no se conoce el valor de P ; en estos casos, se acostumbra tomar el valor de 0,50 con 
lo cual se obtiene el maximo valor de n. 
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E jemplo 7. ^Que tamano de muestra parece razonable, para un nivel de confianza del 99% con un error 
de 2 en cualquier sentido ( ±2), si la desviacion estandar es 12? 


n = - 


2,57 2 12 2 


= 237,7 =23 


n =23 


Tamano optimo en poblaciones finitas 


La formula para el tamano optimo en el muestreo aleatorio simple, cuando la poblacion es finita, se 
obtiene: 


-p 

=> E-H 

=* E 2 - 

( rjl _2 \ 

Z <7 

(N-n^ 

N-n 

^ ^ ~ f— ^ 

V n 

y n 

n 

v / 

N ) 

V N — l 





Siendo n = 


Z 1 No 2 

NE 2 +Z 2 o 2 



<y 2 

11 — 

( 

E^ + aL 

Z) N 


La formula mas utilizada n = 


tin 


1 + Bl 
N 


donde 


n n = 


>y2 2 

Z G 


E 2 


Zg 

E 


Las anteriores formulas que se aplican en variables, tambien con una pequena modificacion pueden 
ser utilizadas en atributos, es decir, cuando se calculan proporciones. Las formulas son: 


n = 


z 2 npq 


(N -\)E 2 + Z 2 PQ 


n = - 


PQ 


p\+iQ 

" N 


"o 

TV I 


siendo —» 


«n = 


Z 2 PQ 


=> n Q se considera como primera aproximacion, dado que algunos investigadores utilizan su valor, 
por considerarlo que economicamente, al igual que el tiempo y los recursos humanos disponibles 
lo permiten. 

E j emplo 8. Si el ejemplo (1) en poblaciones infinitas dijera que el total de cuentas de credito es de 4.000, 
^cual seria el tamano de la muestra? 


n — 


Z 2 7V(T 2 _ 1, 6 2 4 000 30 000 2 

NE 2 + Z 2 ct 2 ~ 4 000 1 500 2 +1, 6 2 30 000 2 


= 1 110,16 = 1 111 cuentas 


tambien: n = 


30 000 2 


E \ , <7 2 

N 


1 500 V 30 OOP 2 


= 1111 cuentas 


1 6 


n = 1 111 cuentas 


4 000 
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Ejemplo . Un investigador esta interesado en estimar la ganancia en peso total, en 0 a 4 semanas de 
1.000 pollitos alimentados con una nueva radon. Obviamente, pesar cada ave serfa tedioso y llevarfa 
demasiado tiempo. Por lo tanto, se debe determinar el numero de pollitos a seleccionar en una muestra, 
para estimar el total con un limite para el error de estimation igual a 1.000 gramos. Muchos estudios 
similares sobre nutrition de pollitos se han llevado a cabo en el pasado. Usando datos de estos estudios, 
el investigador encontro que la varianza es, aproximadamente, de 36 gramos. Determine el tamano de 
muestra requerido, con un confianza del 95%. 


o 


: N = 1 000 


£=1.000 (error total) 


p= 5 z = l, 6 


1.000 

1.000 


= 1 


(error promedid) 



NJZpC 

(n-\)e 2 +z 2 s 2 


1.000(1, 6) 2 (36) 
(1) 2 +1, 6 2 (36) 


= 121,60 = 122 pollitos 


n =122 pollitos 


E j emplo 10. Se desea realizar una investigation sobre el numero de unidades que se encuentran en mal 
estado en 4.000 cajas y la proporcion de cajas que contienen unidades en mal estado. Se realiza una 
encuesta preliminar de 80 cajas con el siguiente resultado, presentado en una tabla de frecuencias: 


No. DE UNIDADES DEFECTUOSAS: 

0 

1 

2 

3 

4 

5 

10 

12 

No. DE CAJAS EX AMIN AD AS: 

37 

16 

8 

8 

4 

2 

2 

3 


Determinar el tamano de muestras que cumpla con las dos condiciones. Para ello el investigador debe establecer 
un error del 6% para el promedio, del 12 % para la proporcion y una confianza del 95%, para ambos casos. 


a) Z = l 6 


l> 2;? 


jV = 4000 x=^Hl = ^ = 1725=173 


111 


-nx 


66- 01725 


n 0 

1 6 2 4000 7, 5 , ™ . 

n =- r-r -= 1 /zU cajas 

4000 0,10 2 + 1 6 2 7, 5 


= 7, 5 E = 0,06 173 = 0,10 

n = 1720 cajas 


b) 


P = = ^ = 0,5375= 0,54 

4000 1 6 2 0,54 0,46 
4000 0,12 2 + l 6 2 0,54 0,46 


= 66 cajas 


n =66 cajas 


El tamano optimo es de 1.720 cajas, ya que se toma el mayor valor de D calculado.. 


Ejemplo 11. El Departamento de Transito y Transporte requiere estimar la proporcion de conductores 
con experiencia de un ano o menos, que puedan clasificarse como conductores descuidados. ^De que 
tamano debera ser la muestra a fin de que los resultados esten dentro de un 2%, con una confianza del 
95%? Se espera observar que aproximadamente % del total de conductores sean descuidados. 
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n = 


E 2 


1, 6 2 0,25 0,75 

0,02 2 


00,75 = 1 


01 Conductores con experiencia de un ano o 
ft =1.801 conductores 

menos 


E jemplo 12. Si en el ejercicio anterior se dijera que el numero de conductores a investigar, es de 10.000, 
^cual sera el tamano de la muestra? (como ejercicio de aplicacion, utilizamos las diferentes formulas 
vistas). 


ft = - 

1 

PQ 


1 N 



0,25 0,75 t t 

ft = ---9-= i ozo Conductores con experiencia de un ano o menos 

0,02 Y , 0,25 0,75 


1,6 


+ - 


10 000 


ft=l 526 conductores 


Z 1 N PQ 

ft =- ~ ^— ft = 

ne 2 +z 2 pq 


1, 6 2 10 000 0,25 0,75 


10 000 0,02 2 +l, 6 0,25 0,75 


- = 1 526 conductores 


Z 2 PO 

n o = n 


X 6 2 0,25 0,75 

0,02 2 


00,75 


1 00,75 
1 00,75 
10 000 


= 1 526 conductores 


E j emplo 13. Un investigador asegura que el promedio salarial de los obreros, en cierto sector industrial 
es de $822,000 y sus edades oscilan entre 17 y 38 anos; ademas, sus gastos en alimentacion deben 
encontrarse entre el 40% y 60% de su salario. Se desea estimar el salario promedio, (suponiendo una 
desviacion tipica d $33,600); al mismo tiempo el porcentaje de sus gastos en alimentacion. Se considera 
un error del 1,5% para el promedio y del 8% para la proportion; ademas la confianza sera del 95% y un 
total de 4.300 obreros; ^cual sera el tamano optimo para las dos caracteristicas? 


a) 


Z 2 S 2 

rk=—r 


ft = 


1, 6 2 33 600 2 
12330? 


ft = - 


2 ,53 


1 + 


2 ,53 
4 300 


- = 2 


obreros 


E= x =0,015 22 000 =12 330 


ft = 2 obreros 


Tama 0 con cor reccion. Si al calcular el tamano de la muestra (n) o la primera aproximacion (nj, 
se utiliza la desviacion tipica o la varianza proveniente de un encuesta preliminar o piloto (n ), de tamano 
menor de 30, algunos prefieren aplicar un factor de correccion a fin de que n o n o , sean un poco mayor, 
dado que la desviacion tipica estimada (S) va a ser menor que la poblacional (cr). De acuerdo a lo anterior 
se tendra que: 


ft = ft 0 = 


2 2l 
Z S 

1+-2" 

. E 2 . 

L n p\ 


— n ° 


l + "o 

N 


n = tamano de la muestra piloto 


Note: Esta formula fue aplicada en algunos ejercic'lOS para resolver ; problemas que se presentan 
desarrollados en el SIL. 
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EJERCICIOS PARA RESOLVER 

La gran mayorfa de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor madon 
en Lfnea SIL. 

E n el capftulo 13 se explica nuevamenteel tema, con masejerciciosdeaplicacion, por la importancia 
quetiene para el investigador 

91. De una poblacion, N = 10.000 personas nos proponemos obtener una muestra, para estimar el 
ingreso promedio por persona. Se quiere que la estimacion muestra, no se aparte en mas de $5,000 
del promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La desviacion tipica es de 
$30,000. ^Cual sera el tamano optimo? 

92. Supongamos que en un area dada, la proporcion de explotaciones agropecuarias que poseen energia 
es de 0,36. ^Cual sera el error de muestreo de la estimacion, utilizando una muestra al azar de 300 
explotaciones, con una confianza del 95% un total de 8.000 explotaciones? 

93. ^Que tamano debera tener una muestra para estimar dentro del 3%, la proporcion de mujeres casadas 
que van periodicamente a consulta ginecologica, en una poblacion de 5.000 mujeres y una seguridad 
del 95%? 

94. Se desea estimar el costo promedio de matrfculas de los estudiantes universitarios de la ciudad. Por 
estudios anteriores y a precios actuales se sabe que la desviacion tipica es de $18,000. a) Calcular el 
tamano muestral fijando para ello un error de ±3.000 y una confianza del 99%; b) Si se considera que 
la poblacion estudiantil que se desea investigar es de 12.000, ^cual seria el valor de /!?; c) Calcular el 
valor de fl si se desea estimar el valor total de la matrfcula cancelada por los 12.000 estudiantes. 

95. La gerencia de una empresa manufacturera desea hacer una investigacion entre sus trabajadores, 
con el fin de establecer si a traves de cursos de entrenamiento y programas de mejoramiento de las 
condiciones del trabajo, tanto en la empresa como en su vida familiar, se logra elevar el rendimiento 
del personal. Con la ayuda de un experto en estudios de tiempos y movimientos, ademas de una 
trabajadora social, se realiza una encuesta preliminar en 70 de los 3.600 trabajadores. Algunos 
resultados de la encuesta fueron: 

a) el tiempo promedio necesario para realizar una operacion fue de 40 minutos, con una varianza 
de 2,4 horas. 

b) 44 de los trabajadores son casados o de union fibre. 

c) El total de gastos mensuales en recreacion de los hijos fue de $59,000, con una desviacion tipica 
del promedio igual a $325,oo. 

N Ota: Las 3 caracteristicas anteriores se consideran importantes en la determinacion del tamano 
de la muestra. Se ha fijado un coeficiente de confiabilidad de 95%, un error del 5% para el 
promedio y 10% para la proporcion. ^Que tamano de fl recomendaria usted? 

96. En un barrio residencial se espera que el 60% de las familias tengan vehiculo propio. Se desea hacer 
una investigacion para estimar la proporcion de familias propietarias de vehiculo, con un intervalo 
de confianza cuya amplitud no sea mayor de 0,03 y un coeficiente de confianza del 95,5% 

a) Determinar el tamano de la muestra. 

b) ^Que sucederia si P = 0,50?; ^si es igual a 0,90? 

c) En el caso del aparte a), si se conoce el numero de familias en el barrio (N = 10.000), ^cual seria 
el tamano de la muestra? 






310 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


97. Un estimativo de la proporcion de articulos alterados de un inventario en deposito, bajo condiciones 
desfavorables, es obtenido con un error maximo de 0,03 y un coeficiente de confianza del 97,5%. 
El total consta de 20.000 articulos y se estima por anticipado que la proporcion de articulos no 
alterados es del 85%. ^Cual debe ser el tamano de la muestra para asegurar un estimativo dentro de 
la precision deseada? 

98. Una oficina de investigaciones sobre salud considera que el 20% de las personas adultas de una 
region, padecen cierta enfermedad parasitaria. ^Cuantas personas tendran que seleccionarse en la 
muestra al azar, para que el error del estimado de la proporcion sea del 7% y tenga una confianza 
del 99%? 

99. Interesa estimar el numero promedio de accidentes de transito en una ciudad. Durante un ano 
(365 dias) se determina una desviacion tipica de 12 accidentes diarios. ^Cuantos dias (tamano 
de la muestra) se requieren observar para no errar en mas de dos accidentes, con un 90% de 
confianza? 

100. Se selecciona una muestra aleatoria simple de familias de clase media baja en un barrio de 
la ciudad, con el fin de estimar el ingreso promedio mensual. El error debe estar en el rango 
de $5.000.oo, con un riesgo de 0,045. /,De que tamano debe ser seleccionada la muestra, si la 
desviacion normal ha sido calculada en $28.000.oo? 

101. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra aleatoria para 
estimar la proporcion de alumnos que utilizan la biblioteca. El error debe conservarse en un 4%, 
con un riesgo del 0,045. ^Cual es el tamano de la muestra, si la universidad tiene 3.200 alumnos 
matriculados? 

102. Determine el tamano maximo de una muestra para estimar una proporcion, con una confianza del 
99%, sin que el error en la estimacion exceda del 2%, para una poblacion de 10.000. 

103. Un investigador a cuyo cargo esta un departamento de educacion fisica, desea hacer una estimacion 
del consumo de oxigeno (en litros por minuto) de los estudiantes normales entre 17 y 21 anos de 
edad, despues de un tiempo especial de ejercicios. El investigador desea que su estimacion se 
encuentre por lo menos a 0,10 litros de la media verdadera, con una confianza del 95%. Estudios 
realizados indican que la varianza del consumo de oxigeno, para grupos similares, es de 0,90. ^Que 
tamano debe tener la muestra que necesita este investigador? 

104. Un investigador de un Instituto descentralizado que tiene 1.500 empleados, desea hacer una 
estimacion del tiempo promedio que gastan los funcionarios, entre el instituto y la casa. El 
investigador desea un intervalo de confianza del 99% y una estimacion comprendida entre 10 
minutos y la media verdadera. Un pequena muestra preliminar dio una varianza de tres horas y 15 
minutos. ^Que tamano debe tener la muestra que necesita el investigador? 

105. Se desea hacer una investigacion sobre el ingreso familiar promedio semanal de los 12.500 hogares 
en una ciudad intermedia. Por investigaciones anteriores, se considera que la desviacion tipica de 
los ingresos es de $30,000. ^Que tamano debe tener la muestra, si se desea hacer una estimacion de 
la media que se encuentra a $3.000.oo de la media verdadera, con un nivel de confianza de 95,5%? 

106. Una trabajadora social que presta sus servicios en una Junta de Accion Comunal, desea hacer un 
estudio para determinar las actitudes de la comunidad frente a los programas que desea emprender. 
Se debe calcular el tamano de la muestra, para hacer una estimacion de la proporcion de ciudadanos 
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que estan de acuerdo con los programas. Investigaciones realizadas anteriormente en zonas similares, 
demuestran que el 72% de las personas entrevistadas contestaron afirmativamente. Ademas, se 
desea que el valor de la estimacion este a 0,12 del valor verdadero, con un 95% de confianza. 

107. Un veterinario quiere hacer una estimacion, en una poblacion de ganado vacuno, sobre la proporcion 
de reses infestadas por un parasito intestinal, a) ^Que tamano de muestra se debe tomar, si se quiere 
que su estimacion este 0,05 de la proporcion real, con 95% de confianza? No se tiene conocimiento 
de P, ni se puede obtener una encuesta preliminar; b) Hallar el tamano de la muestra, suponiendo 
que un estudio anterior encontro que el 28% del ganado estaba contaminado; c) Si el veterinario 
quiere que su estimacion este a 0,02 de la proporcion real y, la poblacion es de 2.000 animates, ^cual 
es el valor de D? (Considere P = 0,5 y P = 0,28). 

108. Un especialista en publicidad desea calcular el tamano de la muestra de hogares en un barrio de 
la ciudad, para determinar en que proporcion, por lo menos, uno de sus miembros ve el programa 
musical. Se desea que la estimacion este a 0,04 de la proporcion verdadera, con un 90% de confianza. 
En una encuesta preliminar a 30 hogares, el 30% de los entrevistados indico que alguien vela 
regularmente dicho programa. 

109. Una universidad desea ofrecer una nueva carrera profesional; para ello debe calcular la proporcion 
de alumnos de ultimo ano de secundaria que piensa estudiar dicha carrera. ^Que tamano debe 
tener la muestra si su estimacion debe estar a 0,03 del valor verdadero, con 95% de confianza? 
a) el ano anterior el 20 % de los alumnos encuestados se inclinaba por una carrera similar; b) El 
numero de alumnos que cursan el ultimo semestre en la ciudad donde se realiza la investigacion, 
es de 6.000. 

110. Un analista de departamento quiere estimar el numero promedio de las horas de entretenimiento 
anual para los supervisores de una division de la compania, con un factor de error de ± 3 horas y un 
95% de confiabilidad. Toma information de otras divisiones para calcular la desviacion tipica de 
horas de capacitacion anual en S = 20 horas. ^Cual es el tamano minimo requerido, si la compania 
tiene 200 supervisores? 

111. Se requiere determinar el tamano de muestra para el estudio del gasto semestral en productos de 
tocador. Para estimar la desviacion tipica de la poblacion, el investigador realiza una encuesta 
preliminar en 80 familias de un barrio de la ciudad, habiendo encontrado una desviacion tipica 
de $13.000.oo. a) ^Cual es el valor de n, si se desea que el valor estandar de la media inferida de 
la poblacion no exceda de $2,400 a un nivel de confianza del 95%. b) ^Cual es el tamano de la 
muestra, si se sabe que en el barrio investigado, viven 1.200 familias? 

112. Un contador desea hacer un estudio sobre los profesores universitarios en la ciudad de Mexico; 
para saber la cantidad de dinero por mes que cada profesor dedica a la alimentacion de la familia. 
Realiza un inventario del numero de profesores vinculados a las diferentes universidades y obtiene 
un listado de 2.000. El contador dice que el promedio de gastos semanales en alimentacion que a el 
interesa, debe encontrarse en alrededor de $30.000.oo, ya que la mayorfa son casados, entre 30 y 50 
anos de edad y el nivel de sueldos es aceptable. Se tiene un desviacion estandar de $2,980, error del 
3% y una confianza del 99%. ^Cual debe ser el tamano de la muestra? 

113. Se selecciona una muestra aleatoria de familias para estimar el ingreso promedio diario. El error 
debe estar en el rango de $22,000, con un riesgo de 0,045. ^De que tamano debe ser seleccionada la 
muestra? La desviacion normal ha sido calculada en $88,000. 
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114. En una region, se realizo una encuesta preliminar para determinar el promedio de empleo en 
explotaciones agricolas; para ello se tomo una muestra simple al azar de 40 explotaciones, con los 
siguientes resultados: 
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Determinar el tamano de la muestra, si se tiene un total de 4.000 explotaciones agricolas, una con- 
fianza del 95% y un error del 5%. 

115. Una encuesta preliminar realizada entre 30 estudiantes de primaria, correspondiente a cinco 
concentraciones escolares localizadas al sur de una ciudad, arrojo los siguientes resultados: 
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El objetivo es poder realizar una investigacion parcial (muestreo), para calcular estimativos del 
promedio de caries por alumno y la proporcion de alumnos con caries. ^Cual debera ser el tamano 
optimo, si el numero de alumnos matriculados en estas cinco concentraciones es de 7.800? Se desea 
un error del 5% y un confianza del 95,5%. 

116. Se realiza una encuesta preliminar a 17 familias en cuanto a tamano, ingreso diario, costo de 
alimentos diarios y si tiene suscripcion a algun periodico de la ciudad. Los resultados fueron: 
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Se quiere determinar el tamano muestral para una poblacion de 1.200 familias, en cuanto a: 

a) estimacion del promedio de personas por familia. 

b) proporcion de familias con suscripcion P = 95% E = 5%. 

117. Suponga que una compama desea estimar la proporcion de cuentas que incluyen gastos por trabajo 
y monto total del ano anterior. Suponga que se ha fijado una confianza del 95% y un error del 5%. 
^Que tamano de muestra se debe seleccionar, si una encuesta preliminar de 30 cuentas dio como 
resultado 12 tarjetas que incluyen gastos por trabajo y el total fue de $5,400,000, con un desviacion 
tipica de $20,000? 

118. Se tomo una encuesta preliminar de 100 colegios de secundaria, de un total de 4.680, dando los 
siguientes resultados: 


TIPO 

CANTIDAD 

NUMERO 
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PUBLICOS 

54 
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29.881.219 

2.024 
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1.729.349 

PRIVADOS 

46 

13.707 

6.366.785 
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33.119 
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Se quiere determinar el tamano de la muestra de los colegios (publicos y privados) con una confian¬ 
za del 95% y un error del 8%, para estimar: 

a) El promedio de alumnos por colegio 

b) La proporcion de colegios privados 

119. Una cooperativa de ahorro y prestamo desea determinar la cantidad promedio que tienen los clientes 
en sus cuentas. La desviacion estandar de todas las cuentas de ahorro es estimada por el gerente en 
$44,000. 

a) ^Que tamano de muestra se requiere para afirmar, con una confianza de 95%, que el error en la 
estimacion no excede de $20,000? 

b) ^Que tamano de muestra se requiere para afirmar, con una confianza de 95%, que el error en la 
estimacion no excede de $30,000? 

120. Determinar el tamano maximo de una muestra de proporciones siendo la poblacion de 30.000 amas 
de casa, con un error estandar de ±2 % y un nivel de confianza del 99%. 

121. Interesa estimar el numero de accidentes de transito en una ciudad cualquiera. Durante un ano 
(365 dias) se determina una desviacion tipica de 12 accidentes diarios. ^Cuantos dias (tamano de 
muestra) debemos observar para no errar, en mas de 3 accidentes, con un 90% de confianza? 

122. Se quiere determinar el tamano de la muestra para un estudio sobre el gasto mensual en productos de 
limpieza para el hogar. Para estimar la desviacion tipica de la poblacion, el investigador utilizo una 
muestra preliminar de 80 familias, habiendo encontrado que la desviacion estandar era de $20,500. 

a) ^Cual es el valor de n si se desea que el error estandar de la media inferida de la poblacion no 
exceda de ± $2,400 con un nivel de confianza del 95%? 

b) ^Cual es el tamano de muestra en el punto anterior, si se sabe que N = 2.000? 

123. Se selecciona una muestra aleatoria simple de familia de clase media en un barrio de la ciudad, con 
el fin de estimar el ingreso promedio semanal. El error debe estar en el rango de $20,000, con un 
riesgo de 0,045. ^De que tamano debe ser seleccionada la muestra, si la desviacion normal ha sido 
calculada en $80,000. 
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124. Entre los estudiantes de cierta universidad privada, se desea una muestra aleatoria para estimar la 
proporcion de lectores de obras literarias. El error debe conservarse en un 5%, con un riesgo de 
0,045. ^Cual es el tamano de muestra requerida? 

125. Una fabrica de gaseosas tiene un total de 628 camiones repartidores; la varianza de las ventas 
diarias de todos los camiones es de 25.000 (miles de $). Se va a seleccionar una muestra aleatoria 
de camiones para realizar con base en ella estimacion de la media poblacional de las ventas. ^Cual 
sera el tamano de la muestra, para que 0,95 sea la probabilidad (confianza) de que la diferencia entre 
la media muestral y la poblacion no exceda de 80 (miles $)? 

126. En una zona donde hay 4.000 viviendas, el porcentaje de propietarios va a ser estimado con una 
muestra no mayor del 2% y el porcentaje de propietarios de autos no mayor al 1%. Con una confianza 
del 90%. 

Se piensa que el verdadero porcentaje de propietarios de vivienda puede estar entre el 45% y el 
65%, y el porcentaje de propietarios de 2 autos entre el 5 y el 10%, ^que tan grande debe ser una 
muestra para satisfacer las dos finalidades? 

127. Una empresa productora de bombillas de 75W, quiere estimar su vida media de tal manera que el 
error estandar de la media inferida no sea mayor a las 25 horas. Se sabe que la vida media tiene una 
desviacion tipica de 100 horas y se desea una confianza del 95% para la estimacion. ^Cuan grande 
debe ser la muestra? ^Cual seria la respuesta si la poblacion fuera de 1.000 bombillas? 

128. Una biblioteca publica quiere calcular el porcentaje de libros de que dispone con fechas de 
publication de 2005 o anteriores. ^De que tamano debe tomar la muestra aleatoria para que se tenga 
un 90% de seguridad de quedar dentro del 5% de la proporcion real de la muestra? Se sabe que la 
biblioteca tiene 5.000 titulos. 

129. El administrador de un restaurante quiere determinar el tiempo promedio que los clientes tardan en 
tomar sus alimentos con el fin de efectuar una ampliation de sus instalaciones. Considera que la 
desviacion estandar razonable es de 10 minutos basados en una muestra anterior hecha a 30 clientes. 
En esa encuesta se encontro que el 75% de los que frecuentan el establecimiento son hombres. Se 
quiere determinar el tamano de la muestra, con un intervalo de confianza de 95%, para tener la 
seguridad de que el promedio quede dentro del 6%. Es de anotar, el dueno afirma, que el promedio 
de permanencia de sus clientes es aproximadamente de una hora. 

130. ^Que tamano de muestra se requiere para una poblacion de 5.000 unidades, si se desea un error del 
8% y un intervalo de confianza del 95%? 

131. A partir de una muestra de 200 observaciones se encontro que, en una remesa, habia 20 acumuladores 
defectuosos. Utilizando un nivel de confianza del 99%, calcule el error de muestreo. 

132. La Secretarfa de Transito y Transporte, requiere estimar la proporcion de conductores con experiencia 
de un ano o menos que pueden clasificarse como conductores descuidddos. i De que tamano deberia 
ser la muestra a fin de que los resultados esten dentro de un 2%, con una confianza del 95%? Se 
espera aproximadamente observar que l A del total de conductores sean descuidados. 

133. El mantenimiento de cuentas de credito puede resultar demasiado costoso si el promedio de compra 
por cuenta, baja de cierto nivel. El gerente de un almacen desea estimar el promedio de cantidad 
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comprada por sus clientes mensualmente, que usan cuenta de credito, con un error no mas de 
$12,500, con una probabilidad aproximada de 0,95. ^Cuantas cuentas deberan ser seleccionadas de 
un total de 7.000, si se sabe que la desviacion estandar de los balances mensuales de las cuentas de 
creditos es de $95,000? 

134. La produccion, en un dia, de tarjetas perforadas es de 3.000. Se quiere estimar el porcentaje de 
tarjetas que tienen, al menos, dos errores mediante una muestra aleatoria simple: a) ^Que tamano 
de muestra es necesario si se acepta un error del 3%?; b) Si alguien que conoce el trabajo, considera 
que el porcentaje podria encontrarse entre el 72 y 80% , ^cual seria el tamano? Debera ser utilizada 
una confianza del 95%. 

135. Al examinar el directorio telefonico de una localidad que contiene 50 mil suscriptores, se desea 
estimar el porcentaje de ellos cuyo apellido empieza con la letra V. Desgraciadamente por error 
de elaboracion del directorio, no se hizo teniendo en cuenta el orden alfabetico sino localizacion o 
direccion. Se pide encontrar el tamano de la muestra, si el porcentaje es considerado en un 10%, con 
un error del 0,5% y una confianza del 95%. 

136. Un fabricante de automoviles, produce una gran cantidad de vehiculos antes de recibir pedidos. 
Le agradaria poder calcular la proporcion de automoviles que debe pintar de verde pampa en su 
produccion por adelantado. Este fabricante ofrece una opcion entre 7 colores, a) ^Que tamano 
de muestra necesitara? Si desea hacer una estimation dentro de un margen del 1% y un nivel de 
confianza del 98% para una produccion de 5.000 vehiculos; b) Defmase la poblacion de interes para 
el fabricante. 

137. Decir si son ciertas o falsas las siguientes aseveraciones: 

a) Se dice que en todo proceso de selection debe haber sustitucion de las unidades que no se han 
podido entrevistar. 

b) El parametro describe una determinada caracteristica de las unidades que conforman la 
poblacion. 

c) El muestreo sistematico consiste en seleccionar uno a uno los elementos de la muestra en un 
orden indeterminado. 

d) A medida que aumenta el error, manteniendo constante la varianza, se aumenta el tamano de la 
muestra. 

e) Una muestra aleatoria es aquella en la cual ciertas unidades tienen mayor posibilidad que otras 
de ser seleccionadas. 

138. La Asociacion de egresados de la universidad esta trabajando para formular una propuesta relativa 
a la consecution de una sede en la universidad. Se tienen 5.600 egresados registrados, de los cuales 
se toma una muestra preliminar del 1%, con la cual se obtiene que 28 de ellos piensan que la idea 
debera ser llevada a cabo. ^Cual debera ser el tamano de la muestra a fin de que la asociacion pueda 
estimar la proporcion de egresados que estan a favor de la propuesta, dentro de un 3%, con una 
confianza del 95%? 

139. Un analista del Departamento de personal, quiere estimar el promedio de horas de entrenamiento para 
los supervisores de la compania y el porcentaje de supervisores que estan de acuerdo con la efectividad 
de esos entrenamientos. ^Cual es el tamano minimo sugerido, si la compania tiene 500 supervisores? La 
confianza sera del 95%, los factores de error son ± 3horas y varianza de 400 horas 2 de entrenamiento, 
se sabe que 6 de cada 10 supervisores se mostraron partidarios, siendo el error del 5%. 
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140. Se tiene la siguiente poblacion de 15 valores: 

X.: 6 2 8 7 2 4 10 9 10 65 4 3 8 6 

Information adicional £x = 90 f =640 

Determine el tamano de la muestra, si se desea un error de + 2 y una confianza del 90%. 

141. El gerente de una tienda de departamentos de tamano medio, ha observado que el total de cuentas 
pendientes por tarjetas de credito de la propia firma ha aumentado en forma alarmante. Para 
formular una politica de descuento por pago oportuno, se desea estimar la cantidad total en pesos 
($) de cuentas pendientes que tengan por lo menos 90 dias de vencidas. ^Cual debe ser el tamano 
de la muestra si se fija el error tolerable de $10,000, con probabilidad de 0,90? Supongase que hay 
1.500 cuentas distintas con 90 o mas dias de vencidas y se piensa que la desviacion tipica de esas 
cuentas vencidas es inferior a $20,000. 

142. Un estimativo del total de articulos alterados de un inventario de deposito de cierto almacen, bajo 
condiciones desfavorables es obtenido dentro de un error de mas o menos + 0,03, con un 97,5% de 
nivel de confianza. El inventario total se debe hacer sobre un total de 20.000 articulos. Para ello se 
realizo una encuesta preliminar de 100 articulos de los cuales 85 no estan alterados. ^Cual sera el valor 
de n? 

143. Un publicista desea calcular el tamano de la muestra de hogares, que va a tomar en cierta region 
para determinar en que proportion de hogares, por lo menos uno de sus miembros ve un programa 
musical de television. En esa region hay un total de 700 hogares y se desea que la estimation 
este a 0,05 de la proportion verdadera, con una confianza del 90%. Anteriormente se realizo una 
encuesta en 40 hogares, en la cual 14 de los entrevistados contestaron que alguien en su casa vela 
regularmente dicho programa. ^Cual debe ser el tamano de la muestra? 

144. Una entidad social dedicada a la protection del nino realizo una muestra al azar de 225 mujeres, 
de una poblacion de 6.000, con el fin de determinar sus actitudes ante ciertos problemas sociales. 
Una de las preguntas que tiene relation directa con el objetivo de la encuesta decia: ^Cree usted 
que las madres de los ninos con una edad inferior a los 7 anos deben trabajar fuera del hogar? 90 
contestaron negativamente. Si se desea que esa muestra tenga una confianza del 95%, ^cual debera 
ser el error en la muestra? 

145. El administrador de una taberna desea estimar la cantidad promedio gastada por su clientela los 
fines de semana, con un error menor de $12,000 y con una probabilidad del 95%. ^Cuantos clientes 
que cancelan la cuenta deberan ser entrevistados, si se sabe que el numero de clientes es de 400? 
Suponga que es administrador sabe que esos gastos varian entre $80,000 y $150,000. 

146. Una firma constructora de apartamentos, desea estimar el promedio de resistencia de las varillas 
de acero utilizadas en la construction. ^Que tamano se requiere para garantizar un riesgo de solo 
0,05 de sobrepasar un error de 5 kg o mas en la estimation? La desviacion tipica de la resistencia 
de este tipo de varillas se estima en 25 kg. y se tiene en el momento de realizar el estudio un total 
de 5.000 varillas. 

147. Un fabricante de automoviles desea estimar el kilometraje promedio por galon de gasolina que los 
clientes obtendran con un nuevo modelo de carburador. ^Cuantos viajes de muestra debe efectuar, 
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a fin de que su estimation tenga una precision de 0,5 kilometros por galon, con una confianza del 
95%, suponiendo que la desviacion tipica es de 1,9 kilometros por galon? 

148. Suponga que una compania desea estimar la proporcion de cuentas que incluye gastos especificos 
por trabajo y el valor promedio por cuenta. Ademas se ha fijado una confianza de 95% y un error 
del 6%. iQue tamano de muestra se debe fijar, si una encuesta preliminar de 30 cuentas dio como 
resultado 12 tarjetas que incluyen gastos especificos, por un valor de $5,400,000 y una desviacion 
estandar de $20,000. 

149. En una ciudad hay 360 fabricas de helados y se requiere realizar una muestra para estimar la 
proporcion de consumo de acuerdo a una nueva forma de presentacion. ^Cual debe ser el tamano de 
la muestra si se desea una confianza del 95,5% y un error del 9%. 

150. Un investigador asegura que el salario promedio de los obreros, en cierto sector industrial, es de 
$750,000 y sus edades oscilan entre los 18 y los 40 anos, ademas sus gastos en alimentacion deben 
encontrarse entre los 40 y 60%. Se desea estimar el salario promedio, (suponiendo para ello una 
desviacion tipica de $40,000) y el porcentaje de los gastos en alimentos. Considere un error del 2% 
para el promedio y un 8% para la proporcion, ademas una confianza del 95% un total de 10.000 
obreros, para calcular el tamano de la muestra. 

151. Se estima que el sesgo en la proporcion de ejecutivos subaltemos que renuncian en companias 
manufactureras grandes, despues de tres anos es del 3%. Se utiliza el grado de confianza de 0,95. Un 
estudio realizado hace varios anos revelo que el porcentaje de ejecutivos subalternos que renuncian 
despues de tres anos fue del 21%. 

a) Para actualizar este estudio, ^cuantos ejecutivos subaltemos deberian estudiarse de los 
archivos? 

b) ^Cuantos funcionarios, de un total de 520 deberian considerarse, si no se contara con una 
estimacion previa? 

152. Se estimara el numero medio de dias de viaje al ano de los vendedores foraneos empleados por una 
empresa. Se utiliza el grado de confianza del 90%. La media de un estudio piloto realizado a 25 
vendedores fue de 5,2 meses y la proportion de viajeros con mas de 100 dias fue del 62%. La empresa 
emplea un total de 620 vendedores que recorren todo el pais. Dicha encuesta permitio conocer o 
estimar la desviacion estandar de 14 dias. ^Cuantos vendedores foraneos deberan considerarse si 
se establece un error del 1,5% para el promedio de viajes y del 12% para la proportion con mas de 
100 dias de viaje? 

153. Un investigador esta interesado en estimar la ganancia total en peso, en un periodo de 0 a 4 semanas 
de 5.000 pollitos alimentados con una nueva racion. Obviamente pesar cada vez seria tedioso y 
llevarfa demasiado tiempo. Por lo tanto, se debe determinar el numero de pollitos a seleccionar en 
una muestra para estimar el total con un limite para el error de estimacion igual a 5.000 gramos. 
Muchos estudios similares sobre nutricion de pollitos se han llevado a cabo en el pasado. Usando 
datos de estos estudios, el investigador encontro que la varianza es aproximadamente de 36 gramos. 
Determine el tamano de la muestra requerido. 

154. Se desea realizar una investigacion sobre el numero de unidades en mal estado, en 4.000 cajas que 
se encuentran en bodega, ademas, la proportion de cajas con unidades en mal estado. Se realiza 
una encuesta preliminar de 80 cajas con el siguiente resultado, que se presenta en una tabla de 
frecuencias. 
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No. DE UNIDADES EN MAL ESTADO: 
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Determinar el tamano optimo para una muestra que cumpla con las dos condiciones anteriores, Para 
ello el investigador establece un error del 6% para el promedio de unidades en mal estado por caja 
y del 12% para la proporcion de cajas con unidades en mal estado. La confianza sera del 95%. 

155. Los gerentes de una cadena de almacenes, han decidido actuar rapidamente y en forma drastica, para 
reducir el numero (frecuencias) y el valor de las perdidas debidas a hurtos. Se han propuesto varias 
alternativas algunas de ellas son costosas. A1 investigarse cada altemativa se hace patente que la 
firma requiere de una estimacion con la mayor precision posible, del porcentaje de compradores que 
cometen hurto y el valor que ello representa. Un examen en fuentes secundarias, revela estimaciones 
de compradores que han hurtado un articulo en la semana pasada que van desde 0,01% al 10%, 
por un valor promedio de $23,000. Mediante una muestra aleatoria simple de compradores, seran 
seguidos durante toda su visita al almacen, mediante la utilizacion de detectives especialmente 
adiestrados. Si la gerencia quiere estar «practicamente segura» que la estimacion no difiera de la 
cifra real del 0,5% en ambos casos, ^cual ha de ser el tamano de la muestra, si para el valor de las 
perdidas, piensa que la desviacion estandar es de $1,500 y el numero de clientes que entran durante 
la toma de la muestra es de 5.000 personas? La confianza en ambos casos es de 95%. 

156. A partir de una muestra de 200 observaciones se encontro que, en una remesa habra 20 acumuladores 
defectuosos. Con una confianza del 95%, calcular el error de la muestra. 

157. Un auditor desea tener un nivel de confianza del 95%, de tal manera que la verdadera proporcion de 
errores no exceda del 6%. Si la poblacion es de 2.000 cuentas, ^que tamano tendra la muestra que 
va a tomar, si el auditor estima que la proporcion de errores es del 4%? 

158. Explique brevemente la diferencia que hay entre: 

a) Estimador y parametro. 

b) Poblacion y muestra. 

c) Estadistica descriptiva e inferencia. 

d) Muestreo aleatorio. y no aleatoria . 

159. Conteste brevemente: 

a) /,Cual es la esencia del teorema del limite central y cual es su importancia? 

b) ^Que condiciones debe reunir un buen estimador? 

c) ^Que significa distribucion de muestreo? 


EJERCICIOSMISCELANEOS 

160. Una muestra aleatoria de 150 apartamentos de un area metropolitana, produce una renta mensual 
promedio de $775,000. Se calculo una renta promedio de $780,000, con base en una muestra 
aleatoria independiente para 120 apartamentos de otra area metropolitana. Supongamos que no hay 
diferencia entre las dos areas respecto a las rentas mensuales promedio de los apartamentos. /,Cual 
es la probabilidad de observar una diferencia entre las medias muestrales, mas grande de la que se 
acaba de presentar, si se supone que la desviacion poblacional es de $20,000 para ambas areas? 
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161. Suponga que la media de la poblacion de las utilidades despues del impuesto, de todos los pequenos 
fabricantes, durante un cierto perfodo, es en realidad de 4,8 millones de pesos, con desviacion 
estandar de 1,5 millones de pesos. ^Cual es la probabilidad de que la utilidad media despues de 
pagar impuestos, calculada mediante una muestra aleatoria de 100 pequenos fabricantes, exceda en 
$300,000? 

162. Un procesador de alimentos envasa cafe en frascos de 400 gramos. Para controlar el proceso, se 
utiliza la siguiente regia de decision. Se seleccionan 64 frascos cada hora; si su peso medio es 
superior a un valor critico, se detiene el proceso y se reajusta; en caso contrario, se continua la 
operacion sin detener el proceso. Determinar el valor critico de modo que haya una probabilidad 
de 0,05 de determinar el proceso cuando esta envasado a un promedio de 407,5 gramos, con una 
desviacion estandar de 2,5 gramos. 

163. Una oficina gubernamental, toma una muestra aleatoria de 400 trabajadores de una fabrica para 
obtener el numero de ellos a favor de la sindicalizacion. Calcule la probabilidad de obtener una 
proporcion muestral que difiera en mas del 3% de la realidad, si la proporcion real de trabaj adores 
a favor de la sindicalizacion se le considera de 20%. 

164. Se desea estimar el gasto mensual en energia electrica por familia de clase media de una ciudad, que 
cuenta con 10.000 familias clasificadas en ese grupo de ingresos. Con base en estudios realizados 
en otras ciudades con estratificacion y comportamiento de consumo similar, se supone que la 
desviacion estandar es de $3,000. Se quiere estimar con una aproximacion de ±$380 del promedio 
real, con 95% de confianza. ^Que tamano de muestra se requiere para dicha investigation? 

165. La asociacion de egresados de la universidad, esta trabajando para formular una propuesta relativa 
a la consecution de una sede en el area de la universidad. Se tiene un total de 3.600 egresados 
registrados, del cual se toma una muestra preliminar del 1%, con lo que se obtiene que 28 de ellos 
piensan que la idea debera ser llevada a cabo. ^Cual debera ser el tamano de la muestra a fin de que 
la asociacion pueda estimar la proporcion de egresados que estan a favor de la propuesta dentro de 
un 3% con una confianza del 95%? 

166. Explique brevemente: 

a) El objetivo del muestreo 

b) “Si se utilizan metodos de muestreo no probabilistico, los resultados, pueden estar sesgados” 

c) Que significa «error de muestreo» 

d) ^En que condiciones es mas apropiado el muestreo no probabilistico que el probabilistico? 

167. Un gerente de una compania, realiza dos muestras de tamano de 120 empleados, cada una, con el fin 
de determinar el porcentaje de ausentismo. En la primera fabrica, durante la semana de observation 
no asistieron 12 personas, mientras que en la segunda fabrica no fueron 16 trabajadores. ^Cual es 
la probabilidad de que la ausencia observada sea mayor, si por experiencia se sabe que es el 3%? 

168. Una maquina vendedora de gaseosas, se encuentra regulada de modo que la cantidad servida tenga 
una distribution normal, con media de 10 onzas y desviacion tipica de 0,82 onzas. Si se toma una 
muestra de 25 vasos, ^que valor excederia el 90% de la media de la muestra? 

169. La duration del viaje que realiza una empresa de transporte intermunicipal, estan distribuida 
normalmente con media de 8 horas y desviacion estandar de 2 horas. Se seleccionan al azar 20 
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de los viajes realizados durante el mes: a) ^Cual es la desviacion estandar de la media? b) <^Que 
proporcion de los viajes estaria entre 7 y 8 Vi horas? c) ^Cual es la probabilidad de que la duracion 
del viaje sea superior a las 9 horas? 

170. Se sabe que el 10% de los estudiantes de una facultad no presenta examenes en la fecha en que se 
programan. Si se selecciona a 30 alumnos de la facultad, ^cual es la probabilidad de que 8 o mas de 
ellos hayan dejado de presentar examenes durante el semestre? 

171. El 12% de la production de una maquina es defectuosa, mientras que en otra similar es del 15%. Si 
se extraen dos muestras de tamano 70 y 90 respectivamente ^cual es la probabilidad de que: 

a) las dos muestras difieran en mas del 3%. 

b) el porcentaje en la muestra A sea superior al de la muestra B? 



Sobre dos aspectos se fundamenta la teoria de las distribuciones muestrales: 

a) La ley de los grandes numeros. Si el tamano de la muestra es lo suficientemente grande, 
la probabilidad de que la media muestral difiera de la media poblacional en mas de una 
diferencia positiva prescripta en forma arbitraria se acerca a cero (0). 

b) Teorema central del 11mite. La distribution de las medias muestrales al azar, se aproxima 
a una distribucion normal a medida que aumenta el tamano de la muestra. 

El objeto de la Inferencia estadistica es la de recoger informacion mediante la realization de 
una muestra, con el fin de utilizarla en el calculo de estimaciones y asi obtener conclusiones 
respecto a los valores estadisticos de la poblacion. 

D istribucidn de muestreo es aquella que puede obtenerse como resultado de un numero 
infinito de muestras aleatorias independientes, cada una de tamano n, provenientes de la 
misma poblacion. 

Las muestras se clasifican en aleatorias y no aleatorias. En la primera, todos los elementos 
tienen la misma posibilidad de ser seleccionados. En las no aleatorias, las unidades se 
seleccionan en forma caprichosa, generalmente por conveniencia. 

El parametro es el resultado que se obtiene al aplicar una medida a las caracteristicas de las 
unidades de la poblacion; por lo tanto sera una cantidad constante. Cuando la media describe 
la caracterfstica de los elementos en una muestra, se denomina estimador puntual, estadigrafo 
o valor estadistico de la muestra. 

Las cuatro (4) propiedades de un buen estimador son: insesgado, consistente, suficiente y 
eficiente. 

El error estandar de la media, es la diferencia que puede haber entre el estimado y el parametro. 
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Las distribuciones muestrales que se estudiaron en el capitulo son: 

a) Distribuciones de medias muestrales. 

b) Distribuciones de medias proporcionales. 

c) Distribuciones de diferencias entre dos medias muestrales. 

d) Distribuciones de diferencias entre dos medias proporcionales. 

El tamano de la muestra depende del comportamiento de sus cuatro (4) componentes: 

a) El grado de variabilidad de los datos. 

b) El nivel de confianza. 

c) El margen de error establecido. 

d) El tamano poblacional. 








Pruebas de ipotesis 

y limites 

de confianza 


uien no duda no puede 
conocer la verdad 
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Conceptos generates, usos y procedimien- 
tos de aplicacion. 

Pruebas de hipotesis con aplicaciones en 
distribuciones de: Medias, Proporciones. 

Diferencias entre dos medias y entre dos 
Proporciones muestrales. 

Teoria de las muestras pequenas. Distri- 
bucion “t” de Student. 

Limites de confianza. 


Sintesis de la Unidad. 


■ Ejercicios para Resolver, resueltos en el 

Sistema de I nformacion en L mea SI L. 

COM PETENC IAS 

El estudiante debera estar en capacidad de: 

□ Entender la utilidad que estas tienen en 
muchos casos de la vida real. 

□ Distinguir, describir y aplicar estas prue¬ 
bas de hipotesis. 

□ Realizar pruebas unilaterales y bilaterales 
cuando las condiciones lo exijan. 

□ Entender, aplicar y explicar Limites de 
confianza. 



□ Distinguir los casos en que se pueda 
cometer errores de Tipo I y II. 

□ Aplicar estas pruebas en muestras grandes 
y pequenas. 
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CONCEPTOSGENERALES 


Es evidente que las distribuciones muestrales, vistas en el capitulo anterior, basadas en la teoria de la 
distribucion normal, desarrollan un papel de gran importancia en la inferencia estadistica. 

La inferencia estadistica comprende dos partes principals, a saber: la estimacion de parametros y 
la prueba 0 docimasia de hipotesis. En este capitulo seran estudiadas, con el fin de desarrollar procedi- 
mientos y observar su aplicacion a problemas corrientes de la vida diaria. 

La inferencia estadistica esta basada en el supuesto de tomar muchas muestras, todas con igual pro- 
babilidad de ser seleccionadas y a traves de una de ellas sabremos algo acerca de la poblacion, mediante 
el calculo de estimadores, que nos permitan hacer aseveraciones, incorrectas algunas veces, establecien- 
dose la probabilidad de error. 

Este metodo se basa en la aplicacion de tecnicas de muestreo, para lo cual se requiere de un buen 
diseno, ademas de la aplicacion de metodos aleatorios de seleccion, cuando las probabilidades son igua- 
les para cada elemento de una poblacion. En algunos casos no requieren ser iguales, siempre que se 
conozcan y sean diferentes a cero. 

En este capitulo, buscamos establecer si el valor del estimador obtenido en la muestra es represen¬ 
tative del parametro o valor estadistico poblacional de la cual se extrajo; ademas, la identificacion de la 
distribucion en la que debe ser utilizada. 


PRUEBA DE IPOTESIS 


Las pruebas de hipotesis, denominadas tambien pruebas de signification, tienen como objeto principal 
evaluar suposiciones o afirmaciones acerca de los valores estadisticos de la poblacion, denominados 
parametros. 

La palabra docimar significa probar. Cuando se hace indispensable tomar una decision sobre la va- 
lidez de la representacion en una poblacion, con base en los resultados obtenidos a traves de una muestra, 
se dice que se toman decisiones estadisticas. Para tomar una decision, es necesario ante todo, plantear 
posibilidades acerca de la caracteristica o caracteristicas a estudiar en una poblacion determinada. La 
suposicion puede ser cierta o falsa. Estas suposiciones se llaman hipotesis estadisticas. 

H ipdtesis estadistica : son supuestos acerca de un parametro o de algun valor estadistico de una po¬ 
blacion. Con esta definicion, encontramos que no todas las hipotesis son hipotesis estadisticas. Se debe 
tomar con referencia a un parametro, ya sea una media aritmetica, una proporcion (porcentaje), varianza, 
etc., para que sea hipotesis estadistica. 


Una hipotesis estadistica, tambien puede considerarse como la afirmacion acerca de una 
caracteristica ideal de una poblacion sobre la cual hay inseguridad en el momento de formu- 
larla y que, a la vez, es expresada de tal forma que puede ser rechazada. 
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E jemplo 1 . Para entender en que consiste una prueba o docima estadistica, supongamos que se efectuan 
100 lanzamientos de una moneda y que se obtienen 60 caras (40 sellos). Vamos a probar la legitimidad 
de la moneda (que no este cargada) tomando en cuenta que al lanzar 100 monedas, lo logico seria que 
cayeran 50 caras y 50 sellos. Sin embargo, al realizar el experimento, encontramos que en vez de obtener 
las 50 caras, se presentaron 60; esta pequena diferencia puede llevarnos a pensar, que la probabilidad 
de presentacion de cara es mayor que la de sello. Dicho en otras palabras, que la moneda esta cargada. 


Determinemos en primer lugar la probabilidad de que se obtengan 60 caras o mas, 


ju= np 

//= fil 100=5 ° 


a - npq 



= V25 =5 


Al determinar la probabilidad de que en el lanzamiento de 100 monedas obtengamos 60 caras o 
mas, utilizamos la Distribucion normal, como aproximacion a la Binomial. 


7 _X-ju _ 5 ,5-50 _ 1 

Zj — — — — 1 . 

o 5 

El area es igual a 0,4713 
0,5000 - 0,4713 = 0,0287 




Se observa que la probabilidad de que se obtengan 60 caras o mas, al lanzar 100 monedas, es de 
2,87%, lo que se considera como una probabilidad muy pequena. 


El resultado anterior de haber obtenido un numero mayor o menor de caras, nos lleva a pensar sobre 
lo sucedido y para ello tenemos dos explicaciones: 


■ La moneda o monedas utilizadas en este experimento es o son fabricadas perfectamente, 
por lo tanto el resultado obtenido es correcto, pero ha sucedido algo raro, pues 
esperabamos igual numero de caras y sellos. 

■ La moneda tiene fallas de fabricacion, por lo que se explica que una de las caras puede 
aparecer con mayor frecuencia. Estamos diciendo que la moneda no esta equilibrada, es 
decir, esta cargada en uno de los lados. 

Con las anteriores explicaciones estamos formulando dos clases de hipotesis. 

La hipotesis puede ser formulada con el fin de rechazarla de acuerdo con el analisis estadistico. Esta 
clase de hipotesis se denomina hipotesis nula y se representa por 0. Se tiene tambien la hipotesis alter- 
nativa por g . En nuestro ejemplo inicial del lanzamiento de 100 monedas, la hipotesis nula corresponde 
a la legitimidad de la moneda, Q : q = 50 obtencion de 50 caras, ya que p = x h y q = np = 100 (1/2) = 
50, la hipotesis alternativa sera a : q 1 50 (que el numero de caras sea mayor o menor de 50), es decir, la 
moneda no es legitima o esta cargada. 
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o o : Es considerada como la hipotesis nula , ya que hace referenda al valor del parame- 
tro que se quiere probar como verdadero. 

1 g : Corresponde a la hipotesis alternativa o falsa, estableciendo que el parametro 
puede ser mayor, menor o igual, de acuerdo con la propuesta hecha en la hipotesis 
nula. 


Tipode error 

En la decision anterior de aceptar o rechazar la moneda (o monedas) de acuerdo con el resultado obtenido, 
puede conducir a error. Se consideran dos tipos de error: 

□ E rror tipo 11 — A ceptar la hipotesis nula (Ha) cuando se ha debido rechazar. En el ejercicio que 
estamos desarrollando, seria: “Aceptar la moneda como correcta, cuando en verdad no lo es”. 

□ Error tipo I — Rechazar la hipotesis nula (Ha) cuando se ha debido aceptar. “Rechazar la 
moneda como incorrecta, cuando en verdad esta equilibrada”. 

Existen por lo tanto, dos posibles decisiones: 
aceptar o rechazar la hipotesis que a la vez puede ser 
cierta o falsa. Veamoslo en la tabla No. 8.1 


Los dos tipos de error son inherentes al proceso 
de la prueba de significacion y la probabilidad de co¬ 
meter error sera igual al nivel de significacion. 


Decisiones en cuanto a los tipos de error 


Tabla 8.1 Tipo de error 


a> 


Verdadera 

Falsa 

s 

o 

'yi 

CJ 

o 

Aceptar 



Rechazar 





■ Si se acepta una hipotesis verdadera, la decision es correcta. 

■ Si se acepta una hipotesis falsa, cometemos el error de tipo II. 

■ Si rechazamos una hipotesis verdadera, cometeremos error de tipo I. 

■ Si rechazamos una hipotesis falsa, la decision es correcta. 


Ejemplo 2. Lo mas indicado y utilizado para 
comprender mejor lo anterior, es el siguiente ejemplo: 
supongamos que se detiene a una persona por robo y 
se le envia al juez quien podra declararlo inocente o 
culpable. Al juez se le presentan los pro y los contra y 
con base en toda la informacion, decide dejarlo fibre 
o condenarlo. El juez, no sabra si hubo error en su 
decision, solo lo podra saber la persona que ha sido 
juzgada. 

Si lo deja fibre y el acusado es culpable se esta- 
ra cometiendo un error (tipo II), si por el contrario, 


Tabla 2.1 



Persona juzgada 

Decisiones 

Del juez 

Inocente 

Culpable 

Libre 



Condenado 
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lo condena siendo inocente, tambien se estara cometiendo error (tipo I); hasta ahi va nuestra decision: 
a cep tar o rechazar pero no sabemos exactamente el error cometido, solo sabemos que se puede cometer. 
Un comentario adicional: para la sociedad ^Cual de las decisiones es la mejor? ^Que opina usted? 

Ejemplo 3. Supongamos con base en una muestra aleatoria, que deseamos probar la hipotesis de que 
el precio medio de un apartamento con tres dormitorios y dos banos, en un barrio de la ciudad es de 
$180,000,000. Explique <^en que condiciones cometeriamos un error y de que tipo? 

o 

□ Error de tipo II, si aceptamos que el precio del apartamento descrito es de $180,000,000 de 
pesos, cuando no lo es. 

□ Error tipo I, si rechazamos el precio de $180,000,000, cuando es cierto. 

El que un error de tipo I o tipo II se cometa, depende de como sea formulada la hipotesis. Veamoslo 
mediante el siguiente ejemplo. 

Ejemplo 4. Supongamos que el decano de una universidad desea contratar los servicios del profesor 
Pedro Perez, para ello es sometido a una entrevista, bajo las siguientes hipotesis: 

a) El profesor Perez es competente para desarrollar la labor. 

b) El profesor Perez no es competente para esa labor ^En que condiciones el decano cometera 
errores de tipo I y de tipo II, en cada caso? 

o 

a) Error tipo I: decidir que el senor Perez no es competente si realmente lo es. 

Error tipo II: decidir que el senor Perez es competente si realmente no lo es. 

b) E rror tipo I: decidir que el senor Perez es competente cuando realmente no lo es. 

Error tipo II: decidir que el senor Perez no es competente cuando realmente lo es. 

Nota: Se aconseja realizar, las veces que sean necesarias, los ejercicios que se dan al principio como 
ejemplos y los primeros ejercicios dados para resolver, cuya solucion esta en el SIL. 

ipotesis nula y alternativa 

Se ha dicho que una hipotesis estadistica es un supuesto, concemiente a los parametros o a la forma de 
la distribucion de probabilidad, correspondiente a una o mas poblaciones dadas. En otras palabras, se 
resume diciendo que corresponde a un enunciado acerca de un valor estadistico (parametro) poblacional. 

La hipotesis se debe formular en forma correcta o logica y debe ser enunciada antes de obtener los 
datos muestrales. Son ejemplos de hipotesis estadistica: 

□ Que el promedio de calificacion que tendran los alumnos en mi curso de estadistica, sea 
superior a 4,0. 

□ El 90% de mis estudiantes aprobaran el curso. 

□ 5% de las unidades producidas por una maquina, seran defectuosas. 



328 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


La hipotesis nula es aquella por medio de la cual se hace una afirmacion sobre un parametro, que se 
va a constatar con el resultado muestral. Cuando el fabricante dice que su producto tiene una duracion de 
5.000 horas, se le considera como hipotesis nula, pues es lo que se quiere probar. 

La hipotesis alternatively es toda aquella hipotesis que difiere de la hipotesis nula, es decir, ofrece 
una altemativa, afirmando que la hipotesis nula es falsa. Para el ejemplo, se podra decir que la hipotesis 
altemativa podra ser: 

□ El fabricante ha exagerado la duracion de su producto (prueba unilateral a la izquierda ). 

□ El producto tiene una duracion superior al senalado por el fabricante (prueba unilateral a la 
derecha). La duracion del producto no es la senalada por el fabricante (prueba bilateral). 

Prueba unilateral y bilateral 

La prueba de hipotesis unilateral es aquella en la cual la zona de rechazo o zona critica esta 
completamente comprendida en uno de los extremos de la distribucion. La prueba es unilateral a 
la derecha (de la curva); cuando la hipotesis altemativa de lo que se quiere probar, hace mencion 
por ejemplo a que los salarios que paga una empresa son mayoress que la calidad de un producto 
es superior; que el rendimiento academico es mejor, etc. Si por el contrario, la hipotesis altemativa 
se refiere a que los salarios son inferiores , que el producto es de menor calidad, que el rendimiento 
academico es bajo o que el productor exagera la duracion del producto, etc., corresponded a una 
prueba unilateral a la izquierda. 

En el caso de que la pmeba comprenda areas o zonas de rechazo en ambos extremos de la distri¬ 
bucion, se dice que la prueba es bilateral o sea que la hipotesis altemativa es diferente; por lo tanto se 
omiten los terminos: superior , mayor , mejor , inferior , bajo, menor , etc. 

Nivel de significacion y puntos criticos 

Se entiende por nivel de significacion , la maxima probabilidad de que se especifique con el fin de hacer 
minimo el primer tipo de error. Generalmente, esta probabilidad se fija antes de escoger la muestra. 

El nivel de significacion se simboliza por alfa ( oc) siendo generalmente del 1%, 5% o 10%, pero se 
puede usar cualquier nivel, dependiendo del tipo de investigacion que se adelante. Existe la costumbre 
de trabajar con el nivel de 0,05 o sea del 5%, especialmente cuando el enunciado del problema no lo da. 

Cuando se trabaja con un nivel del 5%, el resultado es significativo; si se emplea el 1 %, el resultado 
es altamente significativo , y si es del 10%, se considera poco significativo. 

El valor del nivel de significacion corresponde a un area bajo la curva de probabilidad o normal, 
denominada region critica o zona de rechazo. Se tendran casos en que la region critica este situada uni- 
camente la derecha de la curva, se dira que se trata de una docima unilateral a la derecha. Si se situa a la 
izquierda, sera una docima unilateral hacia la izquierda. En caso de considerar dos regiones criticas, se 
hablara de una docima bilateral. 

En las docimas unilaterales se tomara el valor total de alfa; para las docimas bilaterales alfa se divi- 
dira por dos. La region no sombreada o no cubierta por el nivel de significacion se denominara zona de 
aceptacion o de no rechazo. 
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Procedimiento a seguir en las pruebas de ipotesis 


Se presenta en primer lugar una sintesis de los pasos a seguir, luego se amplia cada uno de ellos para que 
se tenga una mejor vision del procedimiento y finalmente, se dan ejemplos para ayudar a resolver las 
inquietudes que se hayan creado. 


1. Formular la hipotesis nula y la alternativa. 

2. Seleccionar el nivel de significacion. 

3. Conocer o estimar la varianza. 

4. Determinar la tecnica y la prueba estadistica. 

5. Determinar los valores criticos y sus regiones de rechazo. 

6. Calcular los datos muestrales, utilizando las formulas correspondientes. 

7. Tomar la decision estadistica, de aceptar o rechazar. 


Ampliemos el resumen anterior; para ello se recomienda tener presente, ademas de los siguientes 
pasos, las alternativas que se dan para cada situacion especial. 
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Establecer las hipotesis : 


H 0 : Hipotesis nula 
H a : Hipotesis altemativa 


r n 
I Ho I 


1 Hi 1 

L J 


a) En el caso de la moneda (normal) y en distribuciones de medias muestrales se podrian presentar 
las hipotesis de las siguientes formas: 


H 0 ju = 50 

H a fl* 50 
(docima bilateral) 

H q jU = 50 

H a n< 50 

(docima unilateral 
a la izquierda) 

H 0 ju = 50 

H a /u > 50 

(docima unilateral 
a la derecha) 

b) En el caso de una distribucion de diferencias entre dos medias muestrale, 

H 0 Mx = My 

II 

H 

O 

=5. 

II 

X 

o 

H a M x *My 

H a M x >My 

H a M x <My 

(docima bilateral) 

(docima unilateral 

(docima unilateral 


a la derecha) 

a la izquierda) 

c) En las proporciones se escribira para cada caso, 

asi: 

s 

o' 

II 

•ft. 

o 

H 0 n p = 0,50 

H 0 - 0,50 

H a fi p * 0,50 

H a n r , > 0.50 

H a fj,p < 0,50 

d) Diferencias entre dos proporciones: 

H 0 M th =Mr 2 

fC 

=3. 

II 

£ 

o 

(C 

II 

£ 

H a M Pl *Mr 2 

H a M Pl >Mr 2 

H a M Pl <Mr 2 


2. Elegir el riesgo : oc = % 

Los niveles de significacion mas utilizados son: l: 

3. Se establecen ciertos supuestos: 

a) La muestra es aleatoria. 

b) La poblacion es normal. 

c) La varianza poblacional es conocida (en la mayoria de los casos no se conoce, por lo 
tanto debe ser estimada). 

4. Se formula la respectiva variante estadistica: 

X-jU 


a) oc = 0,05 o 5% 
< b) °c = 0,01 o 1% 
c) oc = 0,10 o 10% 


a) Distribucion normal : 


o 
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b) Distribution de medias muestrales : 


7 = x-M 

0 

c) Distribucion de proporciones muestrales : 

p-P 


Z = 


x- jU 

S/4n 


Cuando n> 30 


Z = 


Siendo w>30 


p_q 

n 


d) Distribucion de diferencias entre dos medias muestrales : 



n v_( x ~y)-(px-M3 


0 Z — 1 - 

V n \ n 2 

V ”l W 2 


(Siendo n x y n 2 mayores que 30) 
e) Distribuciones de diferencias entre dos proporciones muestrales : 

{p l -p 2 )-{n„ -m p 3 


z = 


Pi ■ 

\Pi<li , P 2 Q 2 
m 


Cuando ri 1 y n 2 > 30 

5 . F ormular los puntos crlticos : Z. y Z s 

a) A1 trabajar con un nivel de significacion del 5% de docima bilateral , se tendra: 

Z s = 1’96 y Z. = -1,96 


b) Con el mismo nivel de significacion y una docima unilateral’. Z= 1,64 6 1,65; si la prueba es hacia 
la derecha; Z. = -1,64 6 -1,65, si la prueba se hace a la izquierda. 


6. Descripcion de la region crit'lCd: 
(Bilateral con un oc = 0,05) 
Z s > 1,96 
Z. < -1,96 



- 1,96 


1,96 


(Docima unilateral a la derecha) 
Z s < 1,64 o 1,65 
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7 . Se le dan valores a la variante estadistica con el fin de obtener el valor de Z. 

En el ejemplo de la moneda, se tiene que: Z = ^ ^ ^ = 1, 

8. Adopter una decision, se acepta o se rechaza la hipotesis nula, de acuerdo al nivel de significacion 
dado. 

Siguiendo el ejemplo 1, donde Z = 1,9, trabajando con una docima bilateral, ademas, con un nivel 
de significacion del 5%, encontramos que el 1,9 se situa en la zona de aceptacion, por lo tanto aceptamos 
la hipotesis nula ( H 0 : p = 50 ), es decir, la moneda es legitima o correcta (no esta cargada). En otras pa- 
labras la diferencia que hay entre el valor esperado (50 caras) y el obtenido en el experimento (60 caras) 
no es significativa. 

DISTRIBUCION DE M EDIAS M UESTRALES ( ) 

Veamos algunos ejemplos, cuando se conoce la varianza poblacional y cuando se desconoce. Como 
orientacion en este ultimo caso, por lo general, despues de senalar el tamano de la muestra, y su media, 
vendra la identificacion de la desviacion tipica, evitando de esta manera que se confunda la desviacion o 
la varianza muestral con la poblacional. 

Prueba cuando se conoce la varianza poblacional 

En los pasos descritos anteriormente, especificamente en el numero 3, se establecera que la varianza 
poblacional (G) supuestamente se conoce. Cuando no es conocida, debera ser sustituida por la varianza 
muestral (S 2 ), siempre y cuando la muestra sea grande, es decir, mayor a 30. En los dos casos el proceso 
de calculo es igual, solo se sustituye a G por S. 


En un ejercicio, cuando tengamos duda sobre la varianza, si es poblacional o muestral, debemos 
observar que despues de mencionar el tamano de la muestra , lo que sigue son resultados muestrales, tal 
como lo presentamos a continuation. 


a) |I = 360 

b) |I = 360 


G =25 

n = 36 


n =25 

-> x =372 


X =372 

S = 25 


E j emplo 1. Un inspector de calidad investiga las acusaciones contra una embotelladora por su deficiente 
llenado que debe ser, en promedio, de 32,5 onzas. Para ello toma una muestra de 60 botellas, encontrando 
que el contenido medio es de 31,9 onzas de liquido. Se sabe que la maquina embotelladora debe producir 
un llenado con una desviacion tipica de 3,6 onzas. /,Puede el inspector llegar a la conclusion, a un nivel 
de significacion del 5%, que se estan llenando las botellas por debajo de su especificacion de contenido? 
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o 

ju = 32,5 


o = 3,6 


n = 60 x = 31,9 


b) oc=0,05 

c) a =3,6 


31 9-32 5 

2 = ’ , ;rr =-i,29 


- 1,64 


3,6/V60 


„ V ft 

o /S 



Como -1,29 se situa en la zona de aceptacion, es valida la hipotesis nula, lo cual significa que el 
inspector no debe llegar a la conclusion, que se esta llenando y vendiendo un producto por debajo de su 
especificacion, al nivel del 5%. 


E jemplo 2. Un proceso esta programado para empacar la cantidad media, de una libra (16 onzas) de cafe. 
Se toma una muestra aleatoria de 36 paquetes; resulta una media de 14,2 onzas y desviacion tipica de 
5,3 onzas. Al nivel del 5%, ^se podra afirmar que no se esta cumpliendo con lo indicado en el empaque? 


o 


Observe que no se esta diciendo que el peso esta por debajo de lo establecido, ya que la media po- 
dria ser cualquier valor. En este caso la prueba es bilateral. 


p=16 n = 36 x = 14,2 S = 5,3 


1) H 0 :ju = 16 
H a :ju± 16 

2) oc = 0,05 

3) 5 = 5,3 


14,2-16 

5,3/V36 


-2,04 



- 1,96 1,96 


Al nivel del 5%, se podra afirmar que no se esta cumpliendo con lo indicado por la fabrica. Se puede 
ver que -2,04 se ubica en la region critica, por lo tanto se estara rechazando la hipotesis nula y aceptando 
la hipotesis altemativa. 


Ejemplo 3. En una oficina de remesas se tienen 500 paquetes con diferentes pesos en kilogramos para 
ser remitidas a diferentes partes del pais. Para conocer el peso promedio de los paquetes se selecciono 
una muestra de 16 de ellas, con los siguientes resultados: 


62 43 60 49 72 56 45 46 37 56 41 43 36 45 56 49 
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Se sabe que la desviacion estandar poblacional es de 10, pero es desconocida la media poblacional 
(|i = 50 verdadera). Cometiendo un riesgo alfa (nivel de significacion) del 5%, docimar 6 probar la hipo- 
tesis de que la media poblacional sea igual: 

a)40 b)49 c)50 d)51 y e)60. 

Observation: se trata de un ejercicio relativo a docimas o pruebas bilaterales. 

Como se conoce la media poblacional verdadera, se puede comprobar si la decision adoptada es 
correcta o no. En efecto, para cada uno de los 5 casos anteriores establecer si la decision es correcta y en 
caso contrario indicar el tipo de error cometido. 

La intencion de este ejercicio es mostrar que a medida que la media poblacional hipotetica se 
aproxima a la media poblacional verdadera se comete error tipo II. 


a) 1) H 0 : |i = 40 2) oc = 0,05 

H d : p^40 

4) 7 _ x _ 49,75-40 _ n 

al^r 10/VT6 ’ 

Z(0,4750)—> Z = 1,96 

Z. t > 1,96 
Z; <-1,96 


3)o= 10 


x = - 


796 

16 


49,75 



- 1,96 1,96 


Z = 3,9 cae en la region critica ( Z > 1,96 ) por tal motivo se rechaza la hipotesis de que p = 40, 
sabiendo que la media verdadera p = 50, estamos rechazando algo falso, por lo tanto no hay error, al 
nivel del 5%. 


b)l) H 0 :/i = 49 2)°c = 0,05 

49 


4) 


z _ x-fi _ 49,75-49 _ 

~ a/4n~ 10/Vl6 

0,5000-0,0250 = 0,4750 


0,30 


j(0,4750)—» Z = 1,96 


3) a =10 



- 1,96 1,96 


Siendo Z = 0,30 cae en la zona de aceptacion, es decir, que aceptamos que p = 49, como sabemos 
que la media poblacional verdadera es 50, estamos aceptando algo falso (error de tipo II), al nivel del 5%. 


c) 1) 

4) 


H 0 :ju = 50 2)oc = 0,05 

H a :ju* 50 

x-jU _ 49,75-50 _ 

cr/V^ 10/Vl6 ’ 

Z = -0,10 se ubica en la zona de 
aceptacion. No hay error, ya que 
aceptamos algo verdadero (/i = 50) 


3)a =10 



- 1,96 


1,96 
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d) 1) H 0 :ju = 5\ 2) oc=0,05 3)o=10 

H a :ju* 51 


4 ) z = x f t = 49 ’ 75 5! = 0 50 

<7/ 4n 10/V16 

^=°,° 2 5 


NJ =0,025 

Z = -0,50 se ubica en la region de 
aceptacion. El error es de tipo II, ya que 
aceptamos algo falso, al nivel del 5%. 

RC 

7A 


RC 

i 

- 1,96 

1,96 

e) 1) H 0 :ju = 60 2) °c=0,05 

H a :ju±6 0 

o 

II 

r 



4 ) z = 49 , 7 5-60 = 410 

10/V16 

^=°,°25. 



v y=°,°25 

No hay error, se rechaza algo falso, 

RC 

7A 


RC 

/ 

al nivel del 5%. 

- 1,96 

1,96 


E jemplo 4. De la “poblacion normal” mencionada en el ejercicio anterior, se extrajo una muestra aleatoria 
de 25 observaciones cuya media muestral es de 54. Empleando los niveles de signification del 1% y del 
5%, docimar 6 probar la hipotesis donde la media poblacional sea: a) 50 b) 49. 

Observation: se trata de cuatro docimas. En cada una de ellas calcular el valor deZy adoptar la 
decision. 


o 

□ Cuando oc = 0,01 

a) 1) H 0 :ju = 50 2) oc=0,01 3)o=10 

50 

4 t 7 - - 54-50 

J ct/V^ 10/V25 

0,5000-0,005 =0,4950 
A (0,4950 ->Z =2,57) 

b) 1) H 0 :ju = 49 2)-=0,01 3)0=10 

49 

4) z = Z ff = ^T7^ = 2,5 
a\4n 10/V25 



- 2,57 2,57 

Z = 2 El 2 se ubica en la zona de aceptacion. 
No hay error, al nivel del 1%. 



- 2,57 2,57 
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Hay error de tipo II, se acepta algo falso, al nivel del 1%. 























336 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


□ Ahora, cuando oc = 0,05 
a) 1) H 0 :ju = 50 2) °c=0,05 3)0=10 

H a :ju* 50 

v_ x-fi _ 54-50 
} a/^r 10/V25 

Z = 2 Se ubica en la zona de rechazo. Se 
dero, al nivel del 5%. 



- 1,96 1,96 


un error de tipo I por rechazar algo verda- 


b) 1) H 0 : ju-49 2)oc=0,05 3)o=10 

H a :ju* 49 


= x-JJ_ = 54-49 _ 
e/4n 10/V25 



- 1,96 1,96 


Z = 2,5 Se ubica en la zona rechazo. No hay error, al nivel del 5%. 


EJERCICIQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 

1. Dado X = 82 G = 15 H =25 Docimar la hipotesis: |Ll = 86 

2. Dado X = 82 5=15 fl = 100 Docimar la hipotesis: (I = 86 

3. Muchos anos de experiencia en un examen de ingreso a la universidad en ingles, arroja una 
calificacion promedio de 64, con una desviacion estandar de 8 . Todos los estudiantes de cierta 
ciudad, en la cual existen 64, han obtenido una calificacion promedio de 68 . /,Puede tenerse la 
certeza de que los estudiantes de esta ciudad son superiores en ingles? 

4. Docimar la hipotesis, de que la distancia media requerida para poder detener un automovil que va a 
20 km/h, es de 25 metros. Con base en una muestra de 100 conductores se obtiene que la distancia 
media es X = 27,3 metros, con una desviacion estandar de S = 6,1 metros. Utilizar un nivel de 
significacion del 5%. 

5. Dado X = 86 S=16yD = 100, docimar la hipotesis |I = 80 frente a la altemativa bilateral q t 
80, al nivel de significacion del 5%. 

6 . Cuatrocientos estudiantes, elegidos aleatoriamente, se someten a un “test” de rendimiento, 
obteniendose los siguientes resultados: x =16 y S = 16, con base en esta informacion docimar la 
hipotesis |I = 74 frente a la altemativa |I 1 74, al nivel de significacion del 1%. 

Nota: cuando se conoce a no debe preocuparse si es peque a 
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7. Dado x = 23,5; <7 = 3,2 y fl =25, docimar la hipotesis |I = 22 frente a la altemativa |I £ 22, al nivel de 
significacion del 5%. 

8. Una encuesta revela que los 100 autos particulars, que constituyen una muestra aleatoria, se 
condujeron a un promedio de 12.500 km durante un ano, con una desviacion estandar de 2.400 km. 
Con base en esta informacion, docimar la hipotesis donde, en promedio, los autos particulars se 
condujeron a 12.000 km. durante un ano, frente a la alternativa de que el promedio sea superior. 
Utilizar el nivel de significacion del 5%. 

9. Una muestra aleatoria de zapatos (fl = 40) usados por los soldados en campana en un desierto, revela 
una vida media de 1,08 anos, con una desviacion estandar de 0,5 anos. Se sabe que en condiciones 
normales dichos zapatos tienen una vida media de 1,28 anos. Al nivel de significacion del 5%, 
^hay razon para sostener que la disminucion de la vida media de los zapatos se debe a su uso en el 
desierto? 

10. Un fabricante de cuerdas, ha establecido con base en una experiencia de muchos anos, que las cuerdas 
tienen una fuerza de ruptura de 15,9 libras, con una desviacion estandar de 2,3 libras. Se efectua un 
cambio en el proceso de fabrication, y se obtiene una muestra de 64 articulos cuya fuerza media de 
ruptura es de 15,0 libras, con una desviacion estandar de 2,2 libras. /,Debe considerarse que el nuevo 
proceso tiene un efecto significativamente negativo respecto a la resistencia de las cuerdas? 

11. Un fabricante sostiene que sus autos consumen en promedio 5,50 galones cada 100 kilometros. 
Un vendedor de la compama comprueba el consumo de gasolina de 35 autos y encuentra que el 
consumo medio de ese grupo es de 5,65 galones cada 100 kilometros con una desviacion estandar 
de 0,35 galones. Con estos datos, ^puede dudarse de lo sustentado por la compama (Nivel del 1%)? 

12. Los salarios diarios en un sector de la industria estan distribuidos normalmente con una media de 
$23,200 y una desviacion estandar de $2,500. Si una empresa del sector, que cuenta con 40 obreros, 
paga, en promedio, $22,200, ^puede decirse que esta compama paga salarios inferiores, al nivel de 
la significacion del 1%? 

13. Un investigador asegura que el gasto promedio semanal de las familias de una determinada region 
en alimentation es de $81,000. Con base en los siguientes resultados para la variable X (gastos 
semanales). X = 80.600 S = 1.100 fl = 100 

iCon el nivel de significacion del 5%, se puede aceptar lo que dice el investigador? 

14. Un distribuidor de botas especiales de trabajo, le garantiza al jefe de una empresa que el promedio 
de duracion de las botas es de 8 meses, con una desviacion tipica de mes y medio. El cliente de la 
empresa decide comprar 36 pares de botas, que en promedio duran 8 meses 10 dias. ^Tiene razon el 
fabricante, con un nivel de significacion del 5%? 

15. Una compama que vende camaron congelado, imprime sobre el envase: “contiene 14 onzas”. Una 
muestra de 25 envases da una media de 13,83 onzas. De las experiencias anteriores se deduce que 
la poblacion del peso de los envases tiene una desviacion tipica de 0,5 onzas. Utilizando un nivel de 
significacion del 5%, ^se puede aceptar lo ofrecido por la empresa? 

16. En una ciudad se usan miles de bombillas cada ano. La marca que se ha usado en el pasado tiene 
duracion media de 1.000 horas, con una desviacion tipica de 100 horas. Se ofrece una marca a un 



338 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


precio mucho mas bajo del que estan pagando por la antigua. Deciden que se cambiaran a la nueva 
marca, a menos que se demuestre que esta no tiene una duracion media inferior a la de la bombilla 
anterior; el nivel de significacion es del 5%. Como consecuencia, se prueba una muestra de 100 
bombillas de la marca, obteniendo una duracion media de 985 horas. Suponiendo que la desviacion 
tipica de la nueva marca es la misma que la antigua, <^que conclusion deberia obtenerse? 

17. Un fabricante de bombillas de destello para fotografia, asegura que la duracion media de su 
producto pasa de las 40 horas. Una compama desea comprar un lote muy grande de dicho articulo, 
si la aseveracion es cierta. Se prueba una muestra aleatoria de 36 bombillas y se halla que la media 
muestral es de 46 horas. Si la poblacion de bombillas tiene una desviacion tipica de 9 horas, i es 
posible que se compren las lamparas? 

18. Una maquina produce en promedio 12 libras de nitrato por minuto. A1 adicionar un compuesto 

quimico a 60 maquinas, estas produjeron un promedio de 15 libras de nitrato por minuto y una S = 
5 ^Se puede concluir que la solucion aumenta la productividad? (oc = 1%) 

19. Un cierto tipo de fusible esta disenado para fundirse cuando la corriente llega a 20 amperios. Se 
toma una muestra de 36 fusibles de un lote de 500 y se encuentra que el punto promedio de fusion 
es de 20,8 amperios, con desviacion estandar de 1,5 amperios. Utilizando una docima bilateral, ^a 
que conclusiones se puede llegar respecto a las especificaciones del lote, a un nivel de significacion 
del 1%? 

20. Un fabricante de aparatos de calefaccion, tiene un proveedor que le suministra ciertos componentes 
que tienen como especificaciones una resistencia de 400°C al calor. El fabricante realiza una 
seleccion al azar de 64 de dichos componentes y comprueba que su resistencia media al calor es 
de 395°C, con desviacion estandar de 20°C. ^Puede llegar a la conclusion de que su proveedor no 
sostiene las especificaciones acordadas, a un nivel de significacion de 5%? 

21. Un test de psicologia tenia una puntuacion media de 78 puntos y una desviacion tipica de 6. Se 
selecciono al azar un grupo de 16 estudiantes siendo su calificacion de 74 puntos ^Puede afirmarse 
al nivel de significacion del 1% que el resultado de este grupo fue inferior? 

22. Una muestra de 200 articulos producidos por una maquina, que debe tener como especificacion un 
diametro de 3,6 cmts, revela un diametro promedio de 3,62 cmts, con desviacion estandar de 0,21 
cm. ^Podria afirmarse que el anterior resultado se ajusta a las especificaciones de produccion? 

23. Un proceso esta programado para empaquetar la cantidad media de una libra de azucar. Se toma 
una muestra aleatoria de 36 paquetes y se encuentra una media de 13 onzas y desviacion tipica de 8 
onzas. Al nivel del 5% se podra afirmar: 

a) ^que se esta vendiendo un producto por debajo de su peso? 

b) i si el promedio verdadero es de una libra, en la prueba anterior, se cometio un error de tipo II? 

24. Una compama afirma que el tiempo necesario para fabricar un articulo es de 53 minutos, con una varianza 
de 1,35 horas. Se toma una muestra de 128 articulos, con un tiempo promedio de 56 minutos. 

a) Al nivel del 5% ^se podra afirmar que el producto requiere un tiempo mayor de fabricacion que 

lo afirmado por la compania? 

b) ^Si el tiempo real de fabricacion es de 50 minutos, en la prueba de significacion se cometio un 
error de tipo I? 
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25. Un gimnasio recien inaugurado en la capital, invita a su afiliacion argumentando una reduccion 
de peso, al menos de 4,6 kilos. Una muestra aleatoria de 34 personas revela que el promedio de 
reduccion de peso es de 4,1 kilos, con desviacion tipica de 1,8 kilos. A un nivel del 1%, ^se puede 
creer lo tan anunciado por el gimnasio? 

26. Un concesionario de automoviles promociona un nuevo modelo de vehiculo, ofreciendo economia 
en el combustible; asegura un promedio de 50 kilometros por galon de gasolina. Se tomo una 
muestra de 35 vehiculos de los 500 que se han vendido y se encontro que el promedio es de 43,8 
kilometros por galon, con desviacion tipica de 15 kilometros por galon. Al nivel del 2%, ^se podra 
decir que el concesionario ha exagerado? 

27. Una muestra aleatoria de 60 obreros de un sector de la industria de la construccion, encontro que el 
promedio de edad es de 24 anos. Sin embargo un alto ejecutivo asegura que el promedio de edad es 
superior a los 22 anos, con una desviacion estandar de 8 anos, ^Se puede aceptar la afirmacion del 
ejecutivo? 

28. Una compama promociona un nuevo ambientador asegurando que mantiene el ambiente agradable 
por lo menos durante 8 horas. Un analisis realizado en 20 ambientes, seleccionados aleatoriamente, 
indico un promedio de 8 horas y media. ^Se puede aceptar la anterior aseveracion? Se sabe por 
experiencia que la desviacion tipica es de una hora y cuarenta y cinco minutos. 

29. Una maquina produce en promedio 650 libras de nitrato por hora. Al adicionar un compuesto 
quimico a 40 maquinas, estas produjeron un promedio de 700 libras de nitrato por hora y una 
varianza de 12.960 libras ^Se puede concluir que la solucion aumenta la production de nitrato? (nivel 
de 1%). 

30. Una muestra aleatoria de 100 profesores universitarios de la capital, dio los siguientes resultados: 

2 X, = 4.000 £ (x, ~ X ) 2 = 9.900 

a) La autoridad educativa afirma que el promedio de edad de un profesor es de 43 anos, promedio 
que consideramos diferente. Pruebe dicha hipotesis al nivel del 5%. 

b) Si en verdad el promedio en la poblacion es de 39 anos, ^que tipo de error cometeriamos? 

31. Un profesor examina a su curso, sabe por experiencia que proporciona un rendimiento con 
calificacion de 78. Su curso actual es de 35 alumnos, tomada como muestra; obtiene una media de 
82 y desviacion tipica de 21. ^Acierta al suponer que es un curso superior? (Nivel del 1%). 

Nota: los problemas que aparecen al final de este capitulo, permiten repasar lo aprendido en las diferentes 
unidadesdel capitulo 8. 


DISTRIBUCION DE PROPORCIONES MUESTRALES 

Los procedimientos de decision, aplicados a las proporciones son similares a los ya indicados para 
las medias muestrales; salvo que por lo general, la desviacion tipica y por ende el error estandar de la 
proportion, se calcula con datos obtenidos en la muestra, con mas de 30 elementos, ya que estamos 
trabajando con muestras grandes. 
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Veamos su aplicacion con algunos ejemplos, luego se tratara de resolver otros ejercicios, con el 
deseo de cubrir algunas situaciones particulares que se presentan en esta distribucion. 

Nota: La varianza de la proporcion se calculara con valores muestrales 

Ejemplo 1. Por estadisticas que se tienen, se ha podido establecer que por lo menos el 40% de los 
jovenes toman regularmente Coca-Cola, cuando tienen sed. Una muestra aleatoria de 450 jovenes revelo 
que 200 de ellos sollan tomar dicha bebida, cuando tenlan sed. ^Cual podrla ser su conclusion al nivel 
del 1 %, acerca de lo que muestran las estadisticas? 


o 


p = 200/450 = 0,44 = 44% «=450 


1) H 0 :P = 0,40 
H a '-P* 0,40 

2) oc=0,01 


: P = 0,40~| 

l A :P±_0A0] 

3) s p = Jpq 


4) Z= Q’ 44 " 0 ’ 40 =1 >7 1 
0,44(0,56) 

450 



- 2,57 


2,57 


Z = 1,71 se ubica en la zona de aceptacion, luego al nivel del 5% la conclusion a que se llega, es la 
de aceptar el 40% que arrojan las estadisticas; por lo tanto, no hay razon para rechazarlas. 

Nota: En todosestos ejercicios siempresetomara la proporcion en la muestra, para el calculo de la varianza 

Ejemplo 2. Un gerente de una compania afirma, que el porcentaje de atrasos en las horas de llegada al 
trabajo cobija al 25% de sus empleados. Solicita al jefe de personal la revision de 40 tarjetas marcadas, 
con las horas de llegada, en la quincena y encuentra que 8 han llegado tarde. Al nivel del 5%, <^hay razon 
para concluir que el gerente de la compania esta exagerando? 


^ = ^jj = 0 > 20 n = 40 

1) /7 0 :P = 0,25 2) »c=0,05 

H a :P< 0,25 

3) 5 /) =V0,2(0, 8 ) =0,40 


4) Z = °’, 2Q °’ = = -0,79 

0,2(0,8) 

40 



- 1,64 

Se ubica Z = -0,79 en la zona de aceptacion; 
por lo tanto podemos concluir, que al nivel del 
5% el gerente no esta exagerando. 


Ejemplo 3. Una empresa, al seleccionar su personal lo somete a un curso de entrenamiento. Por 
experiencia, el 76% de los aspirantes aprueban el curso. Se efectuan ciertos cambios en el programa 
para el cual se inscriben 40 y 24 lo aprueban. i Podria afirmarse que los cambios introducidos reducen la 
seleccion? ( oc =l%). 


















CAPITULO OCHO 

PRUEBA DE HIPOTESIS Y LIMITES DE CONFIANZA 


o 


p 


24 

40 


0,60 


1) // 0 :^=0,76 2) °c=0,01 

H a '-P p < 0,76 

3 ) s T = 



4 ) 



0,60-0,76 
(0,6)(0,4) 
40 


-2,07 



- 2,33 

Como - 2,07 cae en la region de acep- 
tacion, la seleccion no se reduce con los 
cambios introducidos, al nivel del 1%. 


Ejemplo 4. El ministro de educacion de un pais, asegura que el 80% de los estudiantes universitarios 
tienen un ingreso mensual para su sostenimiento, superior a $570,000; usted quiere refutar al ministro 
con un nivel de confianza del 99% y para hacerlo toma una muestra de 300 estudiantes, encontrando 231 
con ingresos mayores a $570,000. ^Tiene razon el senor ministro? 

o 


/> = f?^ = 0 > 77 q = 0,23 


300 

1) H 0 :P = 0,S 
H a :P* 0,8 


2) oc=0,01 


3 ) *p 


(0,77) (0,23) _ 0,177 


300 


300 


= 0,024 



- 2,57 


2,57 


7 0,77 - 0,80 _ - 0,03 _ 

’ 0,024 0,024 


Se acepta la hipotesis de que el 80% de estudiantes tienen ingreso mensual superior a $570.00, al 
nivel del 1%. 

Nota: la palabra superior (en este caso) no implica prueba unilateral derecha, ya que forma parte de la caracteris 
tica y no de aqu No que se quiere probar. 

E| ERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Sterna del nfor mad on 
en Lfnea SI L. 

32. La fraccion de articulos defectuosos de cierto proceso supervisado es 0,14. Un proveedor de 
materia prima ofrece un nuevo producto, asegurando que reduce la fraccion de defectuosos. Con 
las muestras que el proveedor suministra, se hace un ensayo en la produccion con el resultado de 48 
defectuosos de un total de 360. Contrastar si el proveedor tiene o no razon en la calidad de la nueva 
materia prima, con un 5% de significacion. 
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33. El fabricante de ciertoproducto estimatenerel 50% delmercado de la categoria de dicho producto.A1 
realizar un sondeo en una muestra probabilistica de 400 consumidores de la categoria del producto, 
180 de ellos indicaron ser consumidores. ^Es correcta la estimacion hecha por el fabricante? (5%). 

34. Por evidencia experimental, se sabe que las pruebas de ingreso a la universidad son eficaces en un 
80% de los casos, cuando esta correctamente elaborada. Se aplica dicha prueba a 400 estudiantes y 
se obtiene unicamente 300 buenos resultados ^Puede considerarse este resultado, como evidencia 
de que la prueba no estuvo bien elaborada? (oc = 1%). 

35. Suponga que se esta estudiando la compra de una nueva maquina para fabricar tornillos. Se 
comprara la maquina si la proporcion de tornillos que necesiten rehacerse es igual o menor del 
10%. Se examina una muestra de 40 tornillos fabricados por la maquina y necesitan rehacerse 3. 
Con oc = 0,05, ^se puede concluir que no se satisface la condicion exigida? 

36. Un cirujano desarrollo una tecnica quirurgica nueva para una enfermedad, en la cual la mortalidad 
postoperatoria usual es del 20%. Aplica la tecnica en 50 pacientes de los cuales mueren 9. ^Cree 
usted que la nueva tecnica disminuye la mortalidad post-operatoria? (oc = 5%). 

37. Por evidencia experimental, se sabe que cierto tratamiento pediatrico es eficaz en un 80% de los 
casos, cuando esta correctamente suministrado. Se aplica el tratamiento a 400 ninos y se obtienen 
unicamente 300 resultados positivos. ^Puede considerarse dicho resultado como evidencia de que 
el tratamiento estuvo bien administrado? (Nivel del 1%). 

38. En una muestra de 50 neumaticos, fabricados por cierta compania, cinco de ellos no cumplieron las 
normas de calidad. El gerente sostiene que el 12% de sus neumaticos no satisfacen dicha norma. A1 
nivel del 5%. ^Se podra decir que el gerente exagera el porcentaje? 

39. El gerente de un supermercado considera que de 50 clientes que realizaron compras a mediodia, 
siete incluyeron leche en su compra. Realiza una muestra aleatoria a 100 clientes y revela que tan 
solo 10 compraron leche. i A1 nivel 5% se podra deducir que el numero de compradores de leche, 
al mediodia, es inferior al anotado por el gerente? 

40. Una muestra aleatoria de 225 habitantes de apartamentos revelo que 25 poseianperros. ^Proporcionan 
estos datos evidencia suficiente como para concluir, que menos del 15% de los habitantes de 
apartamentos poseen perros? (Nivel del 5%). 

41. Una muestra de ventas con descuento, esta considerando la compra de una gran partida de discos de 
un proveedor que afirma que, en promedio, solo el 2% de los discos tienen fallas. Al examinar 400 
de ellos, la firma encuentra 15 imperfectos. ^Rechazara la empresa esta afirmacion del proveedor? 
(Nivel 5%). 

42. Se sabe que el 25% de los alumnos de una facultad, habilitan asignaturas para la aprobacion del 
curso. Si se toma una muestra de 36 estudiantes, de los cuales 8 habilitan, ^se podra afirmar que el 
porcentaje es inferior? 

43. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los habitantes adultos 
del pais estan en favor de cierto proyecto economico del gobierno. Una muestra aleatoria de 650 
adultos indica que 570 estan a favor del proyecto. Si usted desea rechazar una hipotesis verdadera 
no mas de una vez en cien, ^concluiria que la popularidad del proyecto ha sido exagerada por la 
autoridad? 

44. Una compania desea saber si es valida la informacion, de que el 52% o mas de sus clientes aun 
poseen los vehiculos que compraron hace 8 anos. Una muestra aleatoria de 100 compradores 
seleccionados al azar mostro que 48 de ellos aun los poseen. ^Es valida esta afirmacion, al nivel del 
10 %? 
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45. El jefe de admisiones de una universidad, afirmo en una reunion con las directivas que el 15% de 
los estudiantes que ingresan, se retiran antes de haber completado cuatro semestres academicos. En 
una revision a los registros de los ultimos anos, mediante una muestra aleatoria de 300 alumnos, se 
encontro que 54 se retiraron antes de haber completado los 4 semestres academicos. i A1 nivel del 
1% es valida la afirmacion? 


DISTRIBUCION DE Dl FERENC IAS ENTRE DOS M EDIAS M UESTRALES y x 

Esta prueba esta indicada en aquellos casos cuando se quiere establecer si la diferencia entre dos medias 
muestrales, extraidas de dos poblaciones independientes , son significativas o si una media es mayor o 
menor que la otra. 


Son ejemplos, cuando se quiere probar ^si la accidentalidad vehicular es mayor en 
la poblacion femenina que en la masculina? ^si hay alguna diferencia en los habitos 
de fumar de los hombres y mujeres? ^si la duracion de un producto de la marca A 
es diferente al de la marca B? Como se observa, estos interrogantes encierran la 
comparacion entre dos poblaciones. 


Mediante varios ejemplos, indicaremos el proceso a seguir en la realizacion de pruebas de dife- 
rencias cuando las dos muestras son grandes (mayores de 30) o cuando se dan las desviaciones tipicas 
poblacionales , en este ultimo caso no nos interesa los tamanos muestrales, pues los procesos son iguales, 
solo que las varianzas poblacionales son sustituidas por las varianzas muestrales. 



Veamos estos ejemplos que nos ayudaran a explicar el proceso a seguir e interpretar los resultados 
obtenidos. 

Ejemplo 1 . Supongamos que la empresa desarrollo un curso de entrenamiento para sus tecnicos, 
formando dos grupos y aplicando metodos distintos de entrenamiento. Los dos grupos se consideran 
homogeneos en capacidad. El primer grupo lo componen 36 tecnicos que obtuvieron un puntaje de 6 
(en una escala de 0 a 10 puntos) y una desviacion tipica de 4 puntos y el segundo grupo de 40 tecnicos 
cuyo promedio fue 8,2 y desviacion tipica de 4,3 puntos. ^Se puede concluir que el metodo aplicado al 
segundo grupo fue superior al primero? Nivel 1% 
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x-y 



Z= , 6 8,2 -2,31 

16 18,49 

V 36 40 



El resultado obtenido nos indica que no existe una diferencia significativa que permita concluir que 
el metodo aplicado en B fue superior al de A al nivel de 1%; observemos que -2,31 se ubica en la zona 
de aceptacion. 


Ejemplo 2. Una prueba de resistencia al esfuerzo de dos tipos diferentes de cables, que presentan 
desviaciones tipicas de 35 y 45 respectivamente, se llevo a cabo, seleccionando dos muestras de tamano 
32 y 40, con medias de 905 y 925. ^Proporcionan estos resultados, al nivel del 10%, suficiente evidencia 
de que la resistencia de B es superior a la de A? 


o= 35 o = 45 x=905 

x y 

1) H 0 : /u x = jJ y 2) oc=0,10 

H a :u x <M y 



4) 


7 _ (905 - 925) - 0 

/35 2 45^ 

V 32 40 


- 2,12 


n x - 32 yi 2 — 40 y = 925 



RC 7A 


Z 


- 1,28 


Al nivel del 10%, si nos permite llegar a la conclusion de que la resistencia al esfuerzo del cable B 
es superior a la del cable A. 

Ejemplo 3. Una firma que tiene dos fabricas ubicadas en dos regiones del pais, desea establecer el 
promedio de antiguedad que tienen sus trabajadores, a fin de instaurar un programa para sus pensionados. 
Se toma de la primera fabrica una muestra de 60 obreros, la cual reflejo un promedio de trabajo de 16,4 
anos, con desviacion estandar de 5 anos, mientras que en la segunda fabrica una muestra de 40, fue de 
15,8 anos, con desviacion estandar de 4,2 anos <^A1 nivel del 5% se podra afirmar que hay una diferencia 
significativa en cuanto a la antiguedad en la empresa? 


o 

/ 7 , = 60 n 2 = 40 v = 16,4 y — 15,8 = 5 s y = 4,2 



No hay diferencia significativa, en 
cuanto a la antiguedad en la 
empresa, al nivel del 5% 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nformadon 
en Lfnea SIL. 

46. Se comparan dos procesos de fabricacion. Una muestra de 100 articulos del primer proceso tiene 
una media de 107 y una desviacion estandar de 17. En el segundo proceso, una muestra de tamano 
90 tiene una media de 103 y desviacion estandar de 16. ^Existe alguna diferencia significativa entre 
las medias de ambos procesos? 



TIPO 1 

TIPO II 

Bombillas en las muestras: 

46 

64 

Media de la muestra: 

1.070 horas 

1.041 horas 

Suma de los cuadros de las desviaciones respecto a la media: 

£ (x r x) 2 = 21.000 

T, (yry) 2 = 23.200 


^Son significativamente diferentes, las medias de ambos tipos, con base en el nivel de significacion 
del 1%? 


48. Se requiere comparar el nivel salarial de los empleados de dos empresas. La primera reporta que en 

una muestra aleatoria de 46 empleados, su salario promedio fue de $818,000, con una desviacion 
estandar de $32,000. Se elige una muestra aleatoria de 60 empleados de la segunda empresa 
obteniendose un salario promedio de $842,000 y desviacion estandar de $41.000 ^Con los anteriores 
resultados podemos concluir que los salarios en la primera empresa son inferiores? (Nivel del 1%). 

49. Los siguientes datos pertenecen al desarrollo del trigo bajo los tratamientos A y B: 


TRATAMIENTO A TRATAMIENTOB 

Numero de plantas 44 36 

Altura media 15,6 14,1 

Suma de los cuadros de las desviaciones respecto a la media: £ (x,—x) 2 = 167,52 £ (yry) 2 = 159,89 


^Existe alguna diferencia significativa entre ambas medias? 

50. X { = ingresos mensuales (en cientos de $) de los empleados de una Cia. A y X 2 = ingresos mensuales 
(en cientos de $) de los empleados de una Cia. B. Con respecto a las variables se conocen los siguientes 
datos: 


100 

100 


£ *2 =2.500.200.000 

/=1 

£ X 2j =490.000 n, = ioo 

/=1 

k ? 

II 

o 

o 

X 1 = 5.000 

M [ X 21=24.011.000 



Se sabe ademas, que con la Cia. A el ahorro (y { ) en funcion del ingreso esta dado por y { = 20 + 0,2 x x 
y en la Cia. B el ahorro (y ) en funcion del ingreso esta dado por y 2 = 520 + 0,lx 2 . Se puede aceptar, 
con un nivel de significacion del 5%, que el ahorro promedio de la Cia. A es mayor que la Cia. B? 


51. En una universidad se dice que el rendimiento de la Facultad A es inferior al de la Facultad B. Se 
le ha preguntado al jefe de notas sobre los respectivos promedios y desviaciones tipicas y tan solo 
recuerda estos ultimos, 0,7 y 0,86 respectivamente. Frente a lo anterior se plantea la realizacion de 
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dos muestras de tamano 20 y 28 en cada facultad. Obteniendo promedios de 3,32 y 3,50. i Al nivel 
del 5% se podra aceptar lo que generalmente se dice? 

52. Una cadena de almacenes ofrece dos planes de cuentas de cargo, disponibles para sus clientes con 
cuenta corriente de credito. El departamento de credito desea informacion acerca del comportamiento 
de cada plan, a fin de estudiar sus diferencias. Se considero que una de las variables a estudiar debia 
ser el saldo mensual promedio. Se tomaron dos muestras de tamano de 36 y 40 cuentas, de cada 
plan, con los siguientes resultados: promedios de $95 y $110 mil pesos respectivamente, siendo 
sus desviaciones estandar de$15y$18 mil pesos. <^A1 nivel del 5%, se podra afirmar que existe 
diferencia en el comportamiento de estos planes? 

53. Un departamento de produccion desea determinar si hay alguna diferencia en el rendimiento entre 
el tumo diurno y el nocturno. Una muestra de 80 obreros del tumo diurno revela una produccion 
promedio de 94,3 partes por hora, con una desviacion estandar de 14 partes por hora, mientras que 
otra muestra de 60 obreros de la jornada noctuma alcanza un promedio de 89,7 partes por hora, 
con una desviacion estandar de 17 partes por hora. ^Se podra afirmar, al nivel del 5%, un mayor 
rendimiento en el tumo diurno? 

54. Una fabrica de salsa de tomate desea saber, si una nueva presentacion de su producto aumentaria 
sus ventas. Una muestra de 40 tiendas revelo un promedio mensual de ventas de 310 botellas, 
con la nueva presentacion y una desviacion estandar de 20 botellas. Otra muestra realizada en 34 
tiendas donde se expende el producto con el envase tradicional, revela unas ventas promedio de 292 
botellas con desviacion estandar de 26 botellas. <^A1 nivel del 10%, se puede decir que aumentaron 
las ventas? 

55. Un departamento de investigacion desea saber, si un producto con marca conocida se vende a 
un precio superior al de una marca desconocida. Se procedio a seleccionar 36 almacenes que 
distribuyen el producto cuya marca es ampliamente conocida y 32 almacenes que venden el mismo 
producto, de una marca que apenas entra al mercado. Los resultados fueron en promedio de $86,000 
y de $80,000, con desviacion estandar de $6,200 y $4,800 respectivamente <^A1 nivel del 1%, se 
puede aceptar tal informacion? 

56. Se lanzan al mercado dos productos de diferentes marcas, cada uno como el “mejor” para bajar 
rapidamente de peso, sin causar danos colaterales. Se desarrollan dos encuestas de tamano de 46 
personas que usan el producto Ay 35 del producto B, las cuales arrojan los siguientes datos: con el 
producto A se compmeba una reduccion promedio de 10 libras en un mes, con una desviacion tipica 
de 2,4 libras, mientras que con el producto B, la reduccion promedio es de 12 libras, con desviacion 
estandar de 3 libras. ^A1 nivel del 5% se puede decir que hay una diferencia significativa en su 
efectividad? 

57. Supongamos que dos muestras tomadas al azar, dan los siguientes resultados: 


n, =82 

n 2 = 41 

=4.100 

=2.225 

£jc f 2 = 282.210 

5>, 2 = 213.284 


Probar la hipotesis de que el promedio de la segunda variable es superior a la primera (Nivel 
del 5%). 





CAPITULO OCHO 

PRUEBA DE HIPOTESIS Y LIMITES DE CONFIANZA 


347 


DISTRIBUCION DE DIF ERE NCI AS ENT RE DOS PROPORCIONES 
MUESTRALES 2 

Se ha dicho en repetidas ocasiones, que las proporciones son utilizadas como medidas aplicadas a 
caracteristicas cualitativas (atributos). La prueba de hipotesis, como en los casos anteriores, implica 
el uso de la distribucion normal, que nos permite establecer si hay o no alguna diferencia entre dos 
proporciones, obtenidas en dos poblaciones independientes, o si un grupo tuvo una proporcion mayor 
que el otro. 


Como en el caso de la distribucion de diferencias entre dos medias, consideramos como hipotesis 
nula (Ho) que las dos proporciones de la poblacion son iguales. Veamos su aplicacion con varios ejem- 
plos. 


E jemplo 1. En una encuesta se pregunto sobre los habitos de lectura, utilizando una muestra aleatoria de 
350 senoras que trabajan y otra muestra independiente de 325 que no lo hacen. En el primer caso, 105 
manifestaron que estaban suscritas a cierto tipo de revista. En el segundo, la respuesta fue de 130 que no 
estaban suscritas ni mostraban interes por ninguna revista, argumentando la falta de tiempo. <^A1 nivel del 
1%, se podra afirmar que las senoras que trabajan leen menos que las senoras que no trabajan? 


H a :P 1 <P 2 


P, =|| = 0,30 



0,40 


2 ) oc=0,01 



A1 nivel del 1%, si se puede afirmar que las senoras que trabajan leen menos, que las que no 
trabajan. 


Ejemplo 2. Un gerente de una compania, realiza dos muestras de tamano de 120 empleados, una en 
cada fabrica, con el fin de determinar el porcentaje de accidentes de trabajo en el trimestre. En la primera 
fabrica durante el trimestre de observacion se presentaron 12 casos, mientras que en la segunda, 16. ^A1 
nivel del 5%, se podra afirmar que los accidentes de trabajo son iguales en las dos fabricas? 


1 ) 


H 0 :P l =P 2 

H a :P l *P 2 


e, =#r 0 - 10 


2) oc=o,05 


3 ) 


0,10-0,13 
0,1(0,9) 0,13(0,87) 

120 120 



Podemos concluir que la accidentalidad en el trabajo es igual en las dos fabricas, al nivel del 5%. 
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E jemplo 3. Dos grupos A y B de 100 personas cada uno tienen determinada enfermedad. Un suero es 
dado al grupo A, pero no al B. Por otra parte, los grupos son tratados identicamente. Si encontramos que 
en el grupo A, 75 personas se recobran de la enfermedad y en el B, 65, pruebe la hipotesis de que el suero 
cura la enfermedad. 


o 

n x =100 n 2 -100 


1) 


H 0 :P x =P 2 

H a :P l >P 2 


2) oc=0,05 


3 ) 


Ml I Prf 2 


4) z- Pl ~ Pl 

[j¥h , PiQi 

V H \ n 2 



Al nivel de investigacion del 5%, no podemos aceptar que el suero cure la enfermedad. 


Ejemplo 4. Al investigar la “imagen” de calidad de cierta marca de reloj de pulso, se selecciono una 
muestra de 120 profesionales y 80 talleres de reparacion y se obtuvo la siguiente informacion. Con los 
resultados que se dan a continuacion, ^se podria interpretar, al nivel del 5% que existe una diferencia 
significativa, en cuanto a opinion sobre la marca del reloj? 


IMAGEN DE CALIDAD 

PROFESIONALES 

TALLERES 

La marca es buena. Rara vez sufre descompostura 
en los primeros anos de uso. 

60 

48 

La marca no es buena. Se descompone 
frecuentemente, desde el primer ano de uso. 

60 

32 

Total 

120 

80 


o 


n x =120 n 2 =80 


*= T §= 0 ’ 50 


ft=H = 0,6° 


oc=0,05 
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4) 7 - P\~Pi z= 0,5-0,6 _ -0,1 _ H1 

\Mi | (0,5(0,5) (0,6)(0,4) 0,071 

V n, n 2 V 120 80 

A1 nivel del 5%, se puede concluir que no hay una diferencia significativa en esos resultados. 

EJERCICIQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nformacion 
en Lfnea SIL. 

58. Generalmente se escucha que el equipo de la ciudad debe ganar mas partidos, cuando juega de local 
que de visitante. Se toman al azar 40 partidos de local y 40 jugados por fuera durante las ultimas 
cinco temporadas, con los resultados favorables de 30 y 22 partidos, respectivamente. Al nivel del 
5%, ^con los resultados obtenidos se puede aceptar tal afirmacion? 

59. Un estudio del consumo de cafe en el trabajo, por sexo, mostro en una muestra aleatoria de 200 
mujeres que 128 lo toman durante su trabajo, mientras que una muestra de 150 hombres revelo que 
106 lo toman. ^Hay alguna diferencia entre la proporcion de los dos grupos, en cuanto al habito de 
tomar cafe en el trabajo? 

60. El departamento de matematicas desea determinar si la proporcion de alumnos que pierden la 
materia se debe a su estado civil. Se tomo una muestra de 60 alumnos casados de los cuales 12 la 
habian perdido, mientras que en otra muestra de 60 alumnos solteros, tan solo 10 la perdieron. ^A1 
nivel del 5%, el estado civil influye en el rendimiento? 

61. Un jefe de personal quiere comprobar que la ausencia al trabajo es mayor en el tumo noctumo que 
en el diurno. Selecciona en cada jomada 40 y 50 trabajadores y encuentra que en el mes, para el 
turno diurno 7 trabajadores se excusaron de ir a trabajar, mientras que en la noche faltaron 12. ^Los 
anteriores resultados dan la razon al jefe de personal? (Nivel del 10%). 

62. Un distribuidor de dos marcas de baterias para automovil, asegura que la marca A es mejor que la 

B. Una muestra aleatoria de 50 baterias de la marca A, muestra que 38 de ellas duraron mas de 
tres anos, mientras que de 70 de la marca B, solo 50 duraron mas de tres anos. ^Estos resultados 
confirman la afirmacion del distribuidor? 

63. Un fabricante de helados quiere saber si su producto tiene igual aceptacion entre ninos y ninas de 

secundaria. Se tomaron dos muestras de 40 alumnos cada una, encontrando que 26 ninos y 30 ninas 
prefieren el producto. ^Se podra decir que la proporcion de aceptacion por sexo es igual? 

64. Dos grupos A y B de 500 personas, cada una, presenta la misma sintomatologia. Al grupo A se le da 
una droga que contiene un nuevo compuesto y la droga del grupo B carece de el. Por otra parte, los 
grupos son tratados identicamente. Si encontramos que en el grupo A, 375 personas se recobran de 
la enfermedad y en el B, 325, pruebe la hipotesis de que la droga aplicada al grupo A es mejor que 
la del B, (Nivel del 5%). 

65. Una empresa fabricante de equipos mecanicos patrocina un curso de adiestramiento para su personal 
de ventas y servicio. Los anales del curso mostraron en una encuesta anterior realizada a 100 
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estudiantes que el 64 % lo aprobaron. Se efectuan ciertos cambios en el programa de adiestramiento 
con el objeto de mejorarlo y al ano siguiente, de 100 alumnos del curso, 70 aprobaron. A1 nivel 
del 1% ^Podria considerarse este hecho, como una demostracion de efectividad de las reformas 
introducidas al programa? 

66. Una fabrica tiene dos plantas dedicadas al proceso de llenado; cuando no cumplen con las 
especificaciones deben ser reprocesadas. Cada tres horas se aplica el muestreo y se seleccionan 100 
cajas de cada planta. Encontramos que en la primera planta 8 necesitan reprocesamiento, mientras 
que en la segunda 6 lo requieren. ^Hay alguna diferencia entre A y B en la proporcion de cajas que 
requieren ser reprocesadas? 

67. Un sociologo cree que la proporcion de hombres que pertenecen a un grupo socio-economico 

determinado (grupo A) y que ve regularmente deportes en television, es superado por un segundo 
grupo de hombres (grupo B) que tambien ve deportes. Muestras aleatorias simples de los dos grupos 
arrojan los siguientes resultados: 


GRUPO 

TAMANO 

No. HOMBRES 

A 

n t = 130 

80 

B 

n 2 = ioo 

96 


/,Proporcionan estos datos, evidencia suficiente como para apoyar la tesis del sociologo (Nivel del 
5%)? 

68. Un lider sindical, considera que la proporcion de ejecutivos a favor de una politica de control de 
precios, es menor que la proporcion de obreros a favor del control. Se toman dos muestras aleatorias 
independientes de igual tamano, 100 personas en cada una y se encuentran 42 ejecutivos y 61 
obreros a favor. <^A1 nivel del 1% se podra aceptar la consideracion hecha por el lider sindical? 

69. En un estudio, para averiguar los efectos de usar modelos femeninos en la publicidad para 
automoviles, a un grupo de 50 hombres, (grupo A), se le mostro la fotografia de un automovil con 
una modelo femenina, y la de otro automovil del mismo precio pero sin modelo. A otro (grupo 
B), de 50 hombres, se le mostraron ambos automoviles sin modelo femenino. En el grupo A el 
automovil que aparecia con la modelo fue considerado mas lujoso por 37 de los entrevistados; en 
el grupo B el mismo automovil fue juzgado como el mas lujoso por 23 de los entre vistados. ^Se 
considera que estos datos indican, que usar una modelo influye en el lujo aparente de un automovil? 
(Nivel del 5%). 

70. Un gerente de una compama realiza dos muestras de tamano 120 (una en cada fabrica) con el fin 
de determinar el porcentaje de ausentismo al trabajo. En la primera fabrica, durante la semana de 
observacion no asistieron 12, mientras que en la segunda faltaron 16 trabajadores. i Al nivel del 5%, 
se podra afirmar que la no asistencia en la segunda fabrica es superior a la primera? 

71. Una programadora de TV. afirma que el habito a la programacion deportiva es indiferente al sexo. 
Realiza dos muestras a 120 mujeres y a 150 hombres, encontrando que el 25% de las mujeres no ven 
ningun programa deportivo, mientras que el 15% de los hombres, le encuentran alguna satisfaccion. 
^A1 nivel del 5% se debe aceptar dicha afirmacion? 
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TEORIADE LAS MUESTRAS PE UENAS 


DISTRIBUCION t DE STUDENT 

En problemas referentes a la prueba de hipotesis, cuando se conoce la desviacion tipica poblacional 
no importa que el tamano de la muestra sea grande o pequena. Se dice que una muestra es grande, si el 
numero de unidades es mayor a treinta y es pequena si es menor o igual a treinta. 

En el caso de que se desconozca la desviacion tipica poblacional, se le podra reemplazar por la 
desviacion tipica muestral, siempre que la muestra sea grende. 


Cuando fl >30 (muestra grande), la desviacion tipica se simboliza por S y se considera como un 
buen estimador de la desviacion tipica poblacional, debido a que existe una mayor probabilidad de que 
los valores extremos que toma la variable, queden incluidos en el calculo de la varianza en la muestra, 
tal como ocurre al obtener la varianza poblacional. 

Siendo: S= G la formula para calcular s sera: s 


EC *,-*) 2 


Si fl < 30 (muestra pequena), la desviacion tipica se simboliza por S cuando no se ha efectuado 
ninguna correccion. Se considera que S y por lo general, es menor que G, debido a la poca posibilidad de 
que se incluyan valores extremos de la variable poblacional en la muestra. Por lo tanto se hace necesario 
efectuar algunas correcciones en su calculo, con el fin de convertirla en un buen estimador de la desvia¬ 
cion tipica poblacional. 


Tambien se puede expresar como 


S = 



. En las calculadoras se puede observar: 


X 


o 


n 


y y O n para muestras grandes (fl > 30) o sin corregir cuando la muestra es pequena. Las teclas 


x O n _ x y y °n -1 indican desviaciones tipicas corregidas, es decir, dividida por fl -1 y no por fl. 


Apesar de las correcciones que se le puedan hacer a las desviaciones tipicas, no es efectiva en todas 
las muestras; por tal razon la distribucion de todas las medias muestrales, no tiene un comportamiento 
similar a la distribucion normal, a pesar de ser una distribucion continua. A esta distribucion se le conoce 
como distribucion ”t” de Student, en honor al estadistico irlandes W. S. Gosset, quien escribia bajo el 
seudonimo de Student. Fue enunciada en 1908 y ligeramente modificada por R. A. Fisher (1925). 

Esta distribucion se expresa en forma de campana y simetrica, pero mas achatada y con mas area en 
los extremos, es decir, las areas que corresponden a las regiones criticas o de rechazo. Se puede considerar 
que no hay una distribucion “t”, sino mas bien una familia de distribuciones “t”, dado que las desviaciones 
estandar se modifican a medida que se va aumentando el tamano de la muestra, acercandose a la normal. 




v+1 


( ,2\ 

2 

La funcion de la distribucion “t” es 

+ 

ii 



l v 

v ) 



Grados de libertad. Esta expresion fue introducida por Fisher; dice que los grados de libertad 
de un conjunto de observaciones, estan dados por el numero de valores que pueden ser asignados 
arbitrariamente, antes de que el resto de las variables queden completamente determinadas. Ejem- 
plo: Si tengo cuatro valores: 8 + 10 + 6 + 20 = 44, se observa que puedo asignar tres (3) valores 
arbitrariamente: 16 + 4+10+14 = 44, pero el cuarto debe ser 14 y no lo puedo asignar libremente pues 
la suma debe ser 44. Por lo tanto v = fl -1 = 4 -1 = 3. “o ” se lee “nu” o “niu” y se emplea para simbolizar 
los grados de libertad. 
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Veamos ahora que tratamiento se le debe dar a la varianza o a la desviacion estandar muestral, en 
especial, cuando se van a realizar pruebas de hipotesis, trabajando con muestras pequenas en las diferen- 
tes distribuciones. 

En la determinacion de los puntos criticos, t (inferior) y t (superior), se utiliza la tabla, “t” de 
Student. En primer lugar se fija el nivel de significacion, por ejemplo oc = 0,05; luego se calculan los 
grados de libertad, siendo en distribuciones muestrales: v = fl - 1 y en diferencias de medias muestrales: 
v = n i + n ? - 2. Si la docima es bilateral se tomara el total, suponiendo que sea del 5%, del nivel de 
significacion, para cada una de las regiones criticas oc = 0,05 y si es unilateral , se tomara el doble del 
nivel de significacion asignado, en este caso, sera oc = 0,10. 



Es necesario observar que algunos textos consideran que las muestras son pequenas 
si n i y n r son menores o iguales a 100, pero aqui vamos a considerar que son peque¬ 
nas si H 1 y n r son menores o iguales a 30. 


DISTRIBUCION DE M EDI AS M UESTRALES (M uestras peque as) 


Cuando el problema nos da la desviacion tipica muestral y a la vez el tamano de la muestra es menor o 
igual a 30 (n < 30), se considera que la desviacion esta sin corregir, procediendo a su correccion para 
ser aplicada en la variante estadistica “t”. Simbolicemos a: S (desviacion tipica sin corregir) y (desviacion 
tipica corregida). 


1 ) s=s 



'Z(x l -x) 2 _ l^xf^-nx 2 
_ V n-\ 


3 )t = 


X-fl 

sj V« —1 


En la (3) se puede corregir directamente, al calcular la variante estadistica: 


Ejemplo 1. Una muestra de 25 observaciones tiene una media de 42,0 y una desviacion de 8. Trabajando 
con un nivel de significacion del 1%. ^Existe razon para rechazar la hipotesis de que la media de la 
poblacion es 46,0? 


o 


n = 25 x = 42 fl = 46 
1) H 0 :fi x =46 2) oc= 0 ,01 

'■ Mx ^ 46 


3) 5 = 8 



= 8 ( 1 , 021 ) = 8 , 17 


5 = 8 



- 2,7969 2,7969 
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zn t - 42-46 _ ~4(5) 
8,17/V25 8 47 


-20 

8,17 


-2,45 


6 


42-46 
8 /V25- 1 


-2,45 


V = 25-1 = 24 y oc=0,01 corresponde una t — 2,7969 

Se acepta la hipotesis de que p = 46, es decir, no existe razon para rechazar, que la media de la 
poblacion es 46, al nivel del 1 %. 

Es necesario observar que si el nivel de significacion, como en este ejemplo, es de oc = 0,01 se to- 
mara el mismo nivel para cada una de las zonas criticas (zona de rechazo) tal como aparece en la tabla 
donde dice “nivel de significacion para pruebas de dos colas”, (ver tabla 8.3 ; pagina 358). 

En caso de que sea de una cola, suponiendo que oc= 0,05 debe observarse en la tabla, donde dice 
“Nivel de significacion para pruebas de una cola”, es decir, debe corresponder al doble para pruebas de 
dos colas, asi que a pesar de ser oc= 0,05 se esta trabajando con a = 0,10. 


RESUMEN 


PROBLEMA 



x-ju 
s/yjn -1 


t = 


x-y 


(n x 


1 k 2 + 


( n 2 - l)^ 


«i + 




t = 


x-y 



siendo / = Ikzlhlk -yf 

n x + n 2 -2 


t 


Pi ~ Pi 

M + Pi <h 
n x -1 n 2 -1 
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Tabla 8.3 Tabla de distribution “t” de Student 


NIVEL DE SIGNIFICACION PARA PRUEBAS DE UNACOLA 

G rados 
delibertad 

V 

0,10 

0,05 

0,025 

0,01 

0,005 

0,0005 

Nivel de significacion para pruebas de dos colas 

0,20 

0,10 

0,05 

0,02 

0,01 

0,001 

1 

3,078 

6,314 

12,706 

31,821 

63,657 

636,619 

2 

1,886 

2,920 

4,303 

6,965 

9,925 

31,598 

3 

1,638 

2,353 

3,182 

4,541 

5,841 

12,941 

4 

1,533 

2,132 

2,776 

3,747 

4,604 

8,610 

5 

1,476 

2,015 

2,571 

3,365 

4,032 

6,859 


6 

1,440 

1,943 

2,447 

3,143 

3,707 

5,959 

7 

1,415 

1,895 

2,365 

2,998 

3,499 

5,405 

8 

1,397 

1,860 

2,306 

2,896 

3,355 

5,041 

9 

1,383 

1,833 

2,262 

2,821 

3,250 

4,781 

10 

1,372 

1,812 

2,228 

2,764 

3,169 

4,587 


11 

1,363 

1,796 

2,201 

2,718 

3,106 

4,437 

12 

1,356 

1,782 

2,179 

2,681 

3,055 

4,318 

13 

1,350 

1,771 

2,160 

2,650 

3,012 

4,221 

14 

1,345 

1,761 

2,145 

2,624 

2,977 

4,140 

15 

1,341 

1,753 

2,131 

2,602 

2,947 

4,073 


16 

1,337 

1,746 

2,120 

2,583 

2,921 

4,015 

17 

1,333 

1,740 

2,110 

2,567 

2,898 

3,965 

18 

1,330 

1,734 

2,101 

2,552 

2,878 

3,922 

19 

1,328 

1,729 

2,093 

2,539 

2,681 

3,883 

20 

1,325 

1,725 

2,086 

2,528 

2,845 

3,850 


21 

1,323 

1,721 

2,080 

2,518 

2,831 

3,819 

22 

1,321 

1,717 

2,074 

2,508 

2,819 

3,792 

23 

1,319 

1,714 

2,069 

2,500 

2,807 

3,767 

24 

1,318 

1,711 

2,064 

2,492 

2,797 

3,745 

25 

1,316 

1,708 

2,060 

2,485 

2,787 

3,725 


26 

1,315 

1,706 

2,056 

2,479 

2,779 

3,707 

27 

1,314 

1,703 

2,052 

2,473 

2,771 

3,690 

28 

1,313 

1,701 

2,048 

2,467 

2,763 

3,674 

29 

1,311 

1,699 

2,045 

2,462 

2,756 

3,659 

30 

1,310 

1,697 

2,042 

2,457 

2,750 

3,646 


40 

1,303 

1,684 

2,021 

2,423 

2,704 

3,551 

60 

1,296 

1,671 

2,000 

2,390 

2,660 

3,460 

120 

1,289 

1,658 

1,980 

2,358 

2,617 

3,373 

oo 

1,282 

1,645 

1,960 

2,326 

2,576 

3,291 


Fuente: Esta tabla es un resumen de la Tabla III de Fisher y Yates: Statistical Tables for Biological, Agricultural, and Medical 
R esearch, obra publicada por Oliver & Boyd Ltd., Edimburgo. 

E jemplo 2. Una inspectora de calidad, investiga las acusaciones contra una fabrica de cerveza, porque no 
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llena bien sus envases, afirmando que contienen 35 onzas de liquido. Se muestrearon 28 latas de cerveza, 
encontrando un contenido medio de 33,2 onzas, con una desviacion estandar de 2,2 onzas ^Debe la 
inspectora llegar a la conclusion, al nivel del 5%, que se esta exagerando su contenido? 

o 


n = 28 


x = 33,2 


/v . . 

s = 2,2 


ju = 35 


u = 28-1 = 27 


1) H 0 :/u = 35 2) oc=0,05 

H a :iu< 35 


oc= 0, 


3) 


-^-=2,2 || = 2,24 
n -1 V 27 



- 1,703 


4 ) t = ^-ji= 33 ’ 2 ^ =- 4,25 
' s/jn 2,24/v28 

Tambien: ? = f , = = = -4,25 

s/4n-l 2,2/v28-l 

La respuesta es: al nivel del 5%, el inspector si puede llegar a la conclusion de que se esta exage¬ 
rando el llenado. 


Observese en la tabla 8.3 como se obtiene el valor del punto critico, cuando oc= 0,05 
(nivel de significacion); localizamos el 0,05 donde dice “prueba de una sola cola” y 
encontramos que equivale al 10% en las “pruebas de dos colas”, es decir el doble; 
por lo tanto, siendo el grado de libertad de 27 (u = 28 - 1 = 27) y oc= 0,10 el valor 
de “t” (punto critico) sera de 1,703 y al ser localizada a la izquierda de la curva se 
le da signo negativo. 


Ejemplo 3. Un fabricante desea hacer publico, a fin de aumentar sus ventas, que el contenido de 
nicotina de sus cigarrillos tiene un promedio inferior a los 22 mg. Una oficina gubernamental de salud 
y del medio ambiente, realiza un analisis de 10 cigarrillos y obtiene los contenidos de nicotina para 
cada uno, siendo de: 


21 24 18 16 22 23 20 20 24 16 


a) ^Tiene justificacion lo aseverado por el fabricante?; b) ^Cuando se cometera un error de Tipo II? 


77 — 10 


x=^ = —= 20,4 
n 10 


_ j'Zxf-nx 2 _ /4.242-10(20,4) 


n — 1 


10-1 


2,99 


1) H 0 :ju = 22 
H a :ju<22 


2) oc=0,05 


3) s = 2,99 
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(a) No hay justificacion, aceptar lo aseverado, al nivel del 5%. 

(b) Aceptar que p = 22 mg, cuando el contenido de nicotina es en realidad diferente. 

Ejemplo 4. Una muestra aleatoria de 10 vigas de acero, tiene una resistencia media a la compresion de 
57.498 libras por pulgada cuadrada (l.p.c.), con una desviacion tipica de 539 l.p.c. Docimar la hipotesis, 
de que la verdadera resistencia media a la compresion de las vigas de acero de las que se extrajo la 
muestra es p = 57.000. Utilizar la alternativa bilateral p ^ 57.000 y un nivel de significacion del 1%. 


o 

n = 10 x = 57.498 £ = 539 

1) 57.000 2) oc=io/ 0 

H a : ju^ 57.000 

3) £ = 539 

t _ 57.498-57.000 _ 498(3,00) 
539/VlO-l 539 


// = 57.000 u = 10 —1 = 9 



Aceptamos que p = 57.000, es decir, que es la verdadera resistencia media a la compresion de las 
vigas de acero, con un nivel de significacion del 1%. 

Notd: Se trdbdjo con " t” debido a que n espequenay se da (S) la desviacion tipica de la muestra, 
sin corregir. 


Ejemplo 5. Un fabricante de ciertas piezas de proyectiles sostiene que, en condiciones normales de 
operacion, tienen una duracion media |i = 320 horas. Docimar esta afirmacion frente a la alternativa p t 
320, si 16 piezas duran un promedio de 308 horas con una desviacion estandar de 29 horas. Utilizar un 
nivel de significacion del 5%. 


o 


n = 16 x = 308 £ = 29 ju = 320 v = l5 oc=5% 


1) H 0 :ju = 320 
H a :ju± 320 

2) oc=0,05 3) £ = 29 


= 308-320 = -12(3,87) 

29/V15 29 


-1,60 



Se ubica en la zona de aceptacion, o sea que la duracion promedio es de 320, a un nivel de signifi¬ 
cacion del 5%. 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nformacion 
en Lfnea SIL. 

72. Un estudio a 29 familias de una zona residencial de una ciudad de Colombia, revela que el ingreso 
medio por familia durante 2011 fue de $808,000, con una desviacion estandar de $16,000. Docimar 
la hipotesis, de que el verdadero ingreso medio por familia en Colombia durante 2011 fue de 
$800,000, firente a la altemativa de que no fue de $800,000. Utilizar un nivel de significacion del 
5%. 

73. Un pescador decide que necesita un sedal que resista mas de 10 libras si ha de capturar el tamano 
de pescado que desea. Prueba 16 piezas de sedal de la marca G y halla una media muestral de 10,4 
libras. Si en la muestra se obtiene que la desviacion tipica es de 0,5 libras, <^que conclusion se puede 
sacar del sedal de la marca G.? (Nivel de significacion del 5%). 

74. Un jefe de personal, esta dispuesto a contratar una secretaria para ocupar un puesto a menos que 

ella cometa mas de una equivocacion por pagina mecanografiada. Se elige una muestra aleatoria de 
cinco paginas de las escritas por la aspirante. Las equivocaciones por pagina son: 3 3 4 0 1. 

Utilizando oc= 0,05 ^que decision se debe tomar? 

75. Durante un periodo de 12 meses, el numero de nacimientos de mellizos por mes registrados en un 
hospital son: 201 100321 101. ^Contradicen estos resultados la hipotesis de que el 
promedio de nacimiento de mellizos es de 0,5 por mes? (Nivel del 5%). 

76. Supongamos que una persona quiere tener desconectado su telefono, si el promedio de llamadas 
que hace el dia es menor de 2. Elige aleatoriamente 5 dias y anota el numero de llamadas, asi: 0, 2, 
1, 1,2. Utilizando oc = 0,05, ^deberia retirar el telefono? 

77. Un dispensador de gaseosas esta disenado para descargar 7 onzas. Si se selecciona una muestra de 
16 vasos para medir su llenado, observando que el promedio es de 5,8 onzas con una desviacion de 
1,6 onzas, ^se puede concluir que la maquina no funciona correctamente? 

78. Un test de psicologia tenia un puntaje de 82 puntos; en un grupo de 20 estudiantes el puntaje fue 
de 75, con una desviacion de 9 puntos. A1 nivel del 5%, ^se puede afirmar que la diferencia es 
significativa? 

79. Un profesor realiza un examen a su curso y sabe, por experiencia que proporciona un rendimiento 
de 78 puntos. Si su curso actual lo conforman 25 alumnos y obtienen una nota promedio de 82 y 
desviacion tipica de 21, ^acierta al suponer que es un curso superior? (oc =1%). 

80. El departamento de admisiones de una universidad, sostiene que el promedio de calificacion de los 
alumnos admitidos es de 380 puntos, de un total de 450 que exige. Si se toma una muestra de 25 
alumnos cuyo promedio es de 360, con una desviacion tipica de 40 puntos. Al nivel del 1%, ^se 
puede afirmar que el puntaje de los admitidos es inferior al senalado? 

81. El sindicato de empleados de establecimientos comerciales detallistas, sostiene que el salario medio 
por dia de sus asociados es de $18,250. La asociacion de duenos de establecimientos comerciales 
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detallistas piensan, que el sindicato esta subestimando el salario medio por dia. En una muestra 
aleatoria de 30 empleados, la Asociacion encuentra que el salario medio por dia es de $19,500, con 
una varianza de $9,000,000. Si la asociacion esta dispuesta a rechazar una afirmacion verdadera no 
mas de 5 en 100 (95%), ^rechazara la afirmacion del sindicato? 

82. Un distribuidor de botas especiales para trabajo, garantiza al gerente de una empresa, que el promedio 
de duracion de las botas es de 8,10 meses. La empresa decide comprar 25 pares de botas, que en 
promedio duran 7 meses y 15 dias, con una varianza de 12,5 meses. ^A1 nivel del 5% se podra decir 
que la duracion de las botas es inferior al senalado por el distribuidor? 

83. Anteriormente, un determinado grupo de maquinas habia tenido una duracion media entre 
reparaciones de 200 horas de operacion. El personal de este departamento recientemente termino 
un programa de entrenamiento en el que se destacaba el mantenimiento preventivo del equipo. Las 
siguientes 15 reparaciones tuvieron una media de 210 horas entre cada una, con una desviacion 
estandar de 11 horas. ^Proporciona esto, una prueba suficiente para concluir que el tiempo medio 
entre descompostura aumenta? (Nivel del 1%). 

84. Una muestra aleatoria simple de tamano 12 de una poblacion, presento los siguientes resultados: 

128 158 174 201 193 160 172 120 125 136 184 192 

/,Proporcionan estos datos, evidencia suficiente para poder concluir que la media poblacional es 
superior a 160? (Nivel del 1%). 

85. El fabricante de un cierto modelo de automovil afirma, que el kilometraje medio de este modelo es 

de 42 km por galon de gasolina corriente. Un organismo de defensa del consumidor piensa que ese 
kilometraje promedio ha sido exagerado por el fabricante. Nueve automoviles de este modelo son 
conducidos del mismo modo con un galon de gasolina corriente. Los kilometros recorridos por los 
diversos automoviles son: 


42 

41 

40 

40 

30 

41 

35 

43 

42,5 


Si el organismo desea rechazar una afirmacion verdadera no mas de una vez en 100, ^rechazara la 
afirmacion del fabricante? 


86. Una distribuidora de gas ofrece a sus clientes el servicio en un maximo de espera de 48 horas. Se 
toma una muestra de seis hogares que hicieron pedidos y se encontro lo siguiente: 24 20 60 72 
40 30 ^se puede creer lo ofrecido por la distribuidora? 


DISTRIBUCION DE UNA PROPORCION MUESTRAL 


En muestras pequehas , correspondiente a distribuciones proportionates, se aplica un procedimiento casi 
igual que en las muestras grandes, con la diferencia de ser una distribucion “t” de Student, que a la vez 
implica para varios autores corregir el error estandar de la proporcion. La formula a utilizar es: 


t 


p-P 


pq 

n-\ 


Veamos algunos ejercicios con aplicacion a este tipo de distribucion. 
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E jemplo 1. Se dice con frecuencia, que la proporcion de funcionarios publicos que tienen el habito de 
fumar en horas de trabajo, es del 42%. La oficina gubemamental de salud desea realizar una campana a 
fin de disminuir este porcentaje, para ello debe comprobarlo; asi que decide realizar una investigacion de 
muestreo a 25 funcionarios, encontrando que 13 de ellos fuman. ^Anivel del 1% la oficina puede aceptar 
el porcentaje del 42% como indicador? 

Solucion: 

ju p =P = 42% p = ±| = 0,52 n = 25 v = n -1 = 24 

1) H 0 : fi p = 0,42 2) oc=0,01 3) s p = ^ 

H a :ju p ± 0,42 

4) f= 0,52-0,42 
1 0,52(0,48) 

V 25-1 

Si hay razon para aceptar el 42%, como indicador de fumadores en horas de trabajo, al nivel del 1%. 

Ejemplo 2. El distributor de una maquina afirma, que el maximo de elementos defectuosos por hora 
que presenta su funcionamiento es del 3%. En una determinada hora, se toma como muestra 20 articulos 
producidos, los que a su vez son sometidos a control, encontrando un articulo defectuoso. <^A1 nivel del 
5%, se podra decir que el porcentaje de defectuosos es superior al senalado por el distribuidor? 

o 



P = 3% ^ = J^ = 0,05 = 5% n = 20 oc=0,05 

1) H 0 :P = 0,03 
H a :P> 0,03 

.. , 0,05-0,03 

0,05(0,95) 

20-1 

1,729 

Con este resultado no se puede concluir, que el porcentaje de defectuosos sea superior al senalado 
por el distribuidor, al nivel del 5%. 


E| ERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Sterna del nfor mad on 
en Lfnea SIL. 

87. El gerente de una Corporacion de ahorros, argumenta que el 30% de los clientes posee saldo 
aproximado a los $150,000. Se desea confirmar tal operacion, mediante una muestra aleatoria a 20 
clientes elegidos al azar, de los cuales 8 tienen saldo superior a los $150,000. Al nivel del 5% ^se podra 
decir que el porcentaje de ahorradores tienen saldos superiores a la afirmacion hecha por el gerente? 




zu 


2) oc=0,05 


■ =0,4 
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88. Una papeleria con un alto volumen de ventas de elementos para estudiantes universitarios, recibe de 
un proveedor cierto articulo, con una garantia del 3% de defectuosos. El dueno de la papeleria desea 
saber, si en los pedidos que hace se cumple la garantia, para ello toma una muestra de 28 articulos 
encontrando 2 con algun defecto. ^Se puede decir que el fabricante no cumple con lo prometido? 

89. A1 frente de la universidad se instala una venta de comida rapida. El encargado del negocio encuentra 
que el 70% de los estudiantes prefieren el pastel de polio, en vez de carne de res. Selecciona una 
muestra de 30 estudiantes para estudiar su preferencia, encontrando que 19 de ellos prefieren el 
pastel de polio. ^Se podra afirmar que el encargado del negocio exagera el porcentaje? 

90. Un fabricante de automoviles afirma que sus autos de tipo familiar, en el 86% de los casos pueden 
resistir un choque de frente a una velocidad inferior a los 70 k/h, si utilizan cierto equipo. Se toma 
una muestra de 18 vehiculos que tienen este equipo; se encuentran que 16 autos resisten un choque 
de frente. ^Se puede decir, al nivel del 1% que el equipo es mucho mas efectivo que la afirmacion 
del fabricante? 

91. Una agencia de empleos, critica el hecho de que el 30% de las personas que son colocadas no, pasan 
la prueba de trabajo en los tres meses. Se quiere comprobar esta critica y del archivo de colocacion 
de empleados selecciona una muestra de 25 y se encuentra que 7 no pasaron la prueba. ^Se puede 
justificar esta critica? 

92. Una dieta especial asegura su efectividad en un 70% de los casos. Se selecciona una muestra de 30 
personas que la han seguido, encontrando que en 18 de ellos ha sido efectiva. ^Se puede asegurar 
que el porcentaje de efectividad es inferior? (Nivel del 5%). 

93. La oficina de control de transito sostiene que el 30% de conductores de vehiculos de servicio 
particular tienen el pase de conduccion vencido. Se lleva a cabo una muestra de 20 conductores, 
encontrando que 9 de ellos tienen el pase vencido. <^A1 nivel del 10%, se puede afirmar que el 
porcentaje es mayor que el senalado por la oficina? 

94. Un cirujano desarrolla una tecnica quimrgica nueva para una enfermedad, en la cual la mortalidad 
postoperatoria usual es del 25%. Aplica la tecnica en 25 pacientes de los cuales mueren 8 /,Cree 
usted que el cirujano considera que su tecnica constituye un progreso con respecto al metodo de 
tratamiento anterior? (oc = 1%). 


DISTRIBUCION DE Dl FERENC IAS ENT RE DOS M E DIAS M UESTRALES 

De acuerdo con el teorema del Limite Central , cuando ambas variables presentan tamanos muestrales (D 1 
y n 2 ) superiores a 30, tendran un comportamiento similar a la distribucion normal , por lo tanto aplicamos 
Z. En el caso, que ambos tamanos muestrales sean menores o iguales a 30, se aplicara la distribucion “t” 
de Student, utilizando diferentes formulas, de acuerdo a la forma en que se de la informacion. Veamoslos, 
bajo el supuesto de que las dos poblaciones de donde se extraen las dos muestras, tienen varianzas 
poblacionales iguales ( cri = cri), supuesto que se cumple en la mayoria de los casos, lo cual permite 
calcular el error estandar de las diferencias entre las dos medias muestrales asi: 

A) Cuando el ejercicio suministra informacion para cada una de las observaciones muestrales, es 
preferible calcular una varianza comun para las dos muestras, siendo: 
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_ Z (*,-*) 2 + X (^~ 3 ; ) 2 

n x +n 2 -2 


s 2 = 


n x +n 2 -l 


Con el resultado obtenido al aplicar la formula anterior, nos permite calcular el error estandar para 
la diferencia entre las medias muestrales. 


s. - = 

x-y 


2 2 

— + — 
1 m n 9 


t = 


x-y 


Y la variante estadistica sera: 


/ 2 2 

—+— 
n x n o 


Algunos ejemplos correspondientes a este primer procedimiento, se daran a continuacion. 


Ejemplo 1. Un fabricante de cigarrillos analiza el tabaco de dos marcas diferentes, para determinar el 
contenido en nicotina y obtiene los resultados siguientes (en miligramos): 


MARCA 

A: 

24 

26 

25 

22 

23 

MARCA 

B: 

27 

28 

25 

29 

26 


^Los resultados anteriores, 
ambas marcas? 


senalan que existe una diferencia en el contenido medio de nicotina en 


Siendo 

n \ + n 2 — 2 



I(x,-X) 2 =10 I(j,-y) 2 =10 


S2l = 1|0 =24 
n 5 


y = XZl = 125 =27 


2 _ 10 + 10 ^20^0. 
5 5+5-2 8 ’ 


s x->=\l-t + 5 


2 ’ 5 ' 2 ’ 5 =VI = 1 


1) H 0 : fi x = n y | H 0 : fj. x = fj, 2 
H a'-Mx*My I ://| +// 2 


4) 


t _ (24-27)_ - 3 _ _ 3 


2) «=0,05 


oc= 0,05 


u = + « 2 - 2 


u=5+5-2=8 


3) Vv=l 



oc=0,05 


Los resultados anteriores, senalan que existe una diferencia significativa en el contenido medio de 
nicotina en ambas marcas, al nivel de 5%. 

Ejemplo 2. Las calificaciones obtenidas a traves de dos muestras a estudiantes diumos y noctumos, 
respectivamente fueron: 
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DIURNO: 

3,5 

4,2 

3,8 

3,6 

4,0 

3,6 

4,2 

4,8 

4,0 

3,6 

NOCTURNO: 

3,2 

3,6 

3,4 

3,8 

4,0 

3,2 

3,6 

3,4 




^Los anteriores resultados, permiten concluir, que hay una diferencia en el rendimiento de los estu- 
diantes diurno y nocturno? 


3) ^ = 

4) /= 


[l 55,89 -10(3,93) 2 ] + [99,96 - 8(3,53) 2 ] 


10 + 8-2 
3,93-3,53 


2 2 

S t s 


0,11 0,11 


= 2,54 


10 


8 


= 0,11 


A1 nivel del 5%, se puede concluir 
que hay diferencias en el rendimiento 
entre los estudiantes segun la jomada de estudio. 



B) Ahora, cuando las o a a a t a a a a a a estas supuestamente estan 

corregidas, es decir, fueron obtenidas aplicando las siguientes formulas: 


„2 _ 'L(X f ~x) 2 _ 2> 2 -«! X 2 


2 _l(y r -y) 2 _Y,y]-n 1 y 1 

Sj 1 1 

n x — 1 n x — 1 

y 

7 n 2 -1 n 2 -1 


Estos dos resultados se pueden utilizar, para calcular el error estandar de la diferencia entre las dos 
medias muestrales, asi: 


S- - - 

x-y 


j (n, — 1) s x + (n 2 -\ )s 

H \ + n 2 ~ ^ 



Por lo tanto la variante estadistica en este caso, sera: 


t = 


x — y 


Oi -l)s x +(n 2 -l)s 


n x +n 2 - 


t = - 


n x 


(wi-i)^i +(« 2 -i> 2 
n \ + n 2 ~ ^ 


^ + -L 


Observemos que este procedimiento empleado, debe arrojar un resultado exactamente igual a aquel 
en donde se dan los valores para las variables muestrales, dado que las formulas son las mismas, pero 
presentadas en forma diferente. Veamoslo: 


s 


2 


(«i -!)«* + (n 2 -\)s 




y 


—\2 




+ 0*^4) 


H \ + n 2 ~ ^ 


n \ + n 2 ~ ^ 


in- 1) 


in,~ 1) 


nos queda que: 


X(y r -y ) 2 


Ahora, si anulamos a 
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.2 Ih-xY+Zk-yy 
n \ + n 2 - 2 


con lo cual se demuestra que los dos procedimientos de calculo 
son iguales. 


Ahora, consideremos la informacion del ejemplo 1. (pag., 361) 
x = 24 y = 21 


X W, -1 4 


s 2 _ I( y_ 1 zlL _ !0 _ o 5 

-1 4 ’ 


7 


Nota: Hubo en este ejercicio coincidencia en los resultados de las varianzas, ya que en ambas va¬ 
riables resultaron iguales a 2,5. 


Procedemos al calculo del error de las diferencias entre las medias muestrales, siendo: 


S x-y ~ ' 


PWK+C n2-\)s y + 

/7i + ^2 ~ 2 V /7 2 


_ (5-1)2,5 +(5-1)2,5 11 

bx-j; a/ 5_|_5_2 Y5 + 5 1 


Como 


f = 




*-> 


f = 


——— =—- = -3, llegamos a los mismos resultados y conclusiones anteriores. 


Ejemplo 2. Se toma como muestra 6 mujeres y 10 hombres fumadores. Se quiere saber si el numero 
de cigarrillos que consumen los hombres diariamente es superior al de las mujeres, los datos fueron en 
promedio 8 cigarrillos en el grupo de mujeres y 11 en los hombres; las desviaciones tipicas son 2,1 y 1,8 
respectivamente. Al nivel del 5% ^se puede llegar a la conclusion de que los hombres fuman mas que 
las mujeres? 


o 


x = 8 y = 11 £*=2,1 ^=1,8 

1) H 0 :/u x =iu y 2) °c=0,05 u = 6 + 10-2 = 14 



El resultado de -3,04 se ubica en la region critica. Al nivel del 5%, se puede aceptar la conclusion 
de que los hombres fuman mas que las mujeres. 
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Sin embargo, hay muchos casos en que las varianzas poblacionales son desigua- 
les o no se puede comprobar su igualdad. En estos casos no se deben aplicar los 
dos procedimientos anteriores, pues no se ha encontrado una distribucion precisa 
que la describa, tan solo se han elaborado procedimientos aproximados, entre 
estos la “t” de Student con ciertos grados de libertad, mediante la aplicacion de 
la siguiente formula: 

fe/”i)+(^/» 2 ) 

n x -1 n 2 -l 


Ejemplo 3. Consideremos los datos sobre dos tipos de amortiguadores para vehiculos MAZDA, las 
pruebas de duracion resultaron en dos muestras aleatorias, de tamanos 16 y 12 respectivamente, los 
primeros con una duracion de 22,6 meses, y desviacion tipica de 7 meses, mientras que en el segundo 
es de 18,2 meses y desviacion tipica de 5,2 meses. No hay ninguna prueba de que las varianzas 
respecto a la duracion sean iguales. Probar que la duracion no presenta diferencias significativas, al 
nivel del 5%. 


o 


Calculamos en primer lugar los grados de libertad. 

>2 \ 


~ 2 5,2" 


t> = -^ 


21 + 

16 12 


L V 


relA 6 -” 


+ 


5,2 


2 \ 


12 


( 12 - 1 ) 


= (49/16)+ (27,04/12) = 5,32 

V (49/16) (27,04/12) 3,06 2,25 

16-1 + 12-1 15 11 


13,02 


Con un nivel de significacion del 5%, el valor de “t” obtenido en la Tabla es de 2,16 para n = 13 
(grados de libertad). 



El resultado de 1,91, nos permite concluir que las diferencias sobre la duracion de estos amortigua¬ 
dores, no son significativas, al nivel del 5%. 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nformacion 
en Lfnea SIL. 

95. El coeficiente de digestion, al utilizar maiz ensilado como alimento para ovinos, arrojo los siguientes 
resultados: x ] = 58% y Sf= 5%. El mismo resultado en bovinos arrojo: x 2 = 63% y S 2 2 = 8%. 
El numero de animates, por muestra, fue de 15. Se pide determinar si hay diferencias entre los 
coeficientes de digestion de los ovinos y bovinos al nivel del 5%. 

96. Los resultados del control de la calidad en dos procesos manufactureros son los siguientes: 


TIPO 1: 

1,5 

2,5 

3,5 

2,5 



TIPO II: 

2,5 

3,0 

3,0 

4,0 

3,5 

2,0 


^Permiten estos resultados concluir que los precios den como resultado calidades diferentes? (Nivel 
de 10%) 

97. Se propone un nuevo metodo para fabricar concreto. Para docimar (someter a prueba) si el nuevo 
metodo ha aumentado la resistencia a la compresion, se elaboran cinco bloques con cada metodo. 
La resistencia a la compresion, en libras por pulgada cuadrada, resultan ser las siguientes: 


NUEVO M TODO: 

154 

143 

132 

147 

139 

M TODO USUAL: 

144 

131 

155 

126 

134 


^Diria usted que el nuevo metodo ha aumentado la resistencia a la compresion? 


98. La tabla siguiente presenta la ganancia en pesos en dos lotes de ratas: 



DIETA 

RICAEN 

PROTEINA 

POBRE EN 
PROTEINAS 

Numero de ratas 

12 

7 

Ganancia media (gramos) 

120 

101 

Suma de cuadros de las desviaciones 

5.032 

2.552 

respecto a la media 


^Indican estos datos una diferencia significativa entre las ganancias medias en peso correspondiente 
a ambos grupos? 

99. Se requiere comparar el nivel salarial de los empleados de dos empresas. Se solicita dicha informacion 

a la primera de ellas y reporta que en una muestra aleatoria de 17 empleados, su ingreso promedio 
fue de $428,000, con una desviacion estandar de $80,000. Se elige otra muestra aleatoria de 12 
empleados de la segunda empresa y sus salarios son $338; $393; $416; $363; $375; $420; $447; 
$412; $510; $436; $476 y $380 (miles). ^Presentan los datos anteriores evidencia suficiente que 
indique una diferencia en el nivel salarial de los empleados de las dos empresas? 

100. A continuacion se presentan las cifras correspondientes al analisis de proteinas realizadas sobre 
una misma variedad de trigo cosechada en dos distritos. Si estas son las unicas cifras disponibles, 
docime (someta a prueba) si existe o no una diferencia significativa entre la proteina promedio de 
los dos distritos: 
















366 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


DISTRITO 1: 

12,6 

13,4 

11,9 

12,8 

13,0 

DISTRITO 2: 

13,1 

13,4 

12,8 

13,5 

13,3 12,7 12,4 


101. Dos muestras de 15 especimenes cada una, de dos tipos de genero de lana fueron sometidos a una 
prueba de resistencia. La media de la primera muestra, fue de 131 libras por pulgada cuadrada y de 
136 la de la segunda. Las respectivas desviaciones estandar fueron 6,25 y 4,65 libras por pulgada 
cuadrada. ^Indica lo anterior que la segunda calidad de genero es superior? 


102. Una compama desea comprar una maquina que fabrica neumaticos para llantas de bicicleta. Ha 
recibido ofertas de dos productores y quiere determinar si le es indiferente comprar la maquinaria A 
o la B. Basandose en la produccion de las maquinas de cada uno de ellos. Durante 10 dias, elegidos 
al azar, observa la produccion de la maquina ofrecida por A y obtiene que: 


Xu -250 Xu 2 = 6.500. DondeX es el numerode neumaticos producidosporA. Para la maquina 
que ofrece B se observa su produccion durante 15 dias escogidos al azar y se obtiene que: 


S y -35 




= 80 Siendo (y) el numero de neumaticos producidos por esa maquina. Usted es el 


gerente de la compania, tome una decision con un nivel de significacion del 5%. 


103. Una compama esta tratando de decidir cual de dos tipos de neumaticos va a comprar para sus 
camiones. Le gustaria adoptar la marca B a menos que haya alguna evidencia de que la marca A sea 
mejor. Se hace un experimento en el que se utilizan 16 neumaticos de cada marca. Los neumaticos 
se prueban bajo condiciones iguales hasta que se desgastan; los resultados son: 


MARCA A: 

x 26.000 km S 4.200 km 

MARCA B: 

y =25.000 km S =2.800 km 

y 


A un nivel del 5% existe alguna evidencia de que la marca A sea superior a B? 

104. Dos tipos de soluciones quimicas, A y B, fueron ensayadas para ver su PH (grado de acidez de 
la solucion). Analisis de 20 muestras de A dieron un PH de 7,5 con una s = 0,24. Analisis de 12 
muestras de B dieron un PH de 7,4 con una S = 0,30. Docimar si existe una diferencia significativa. 

(oc = 5 %) 


105. De un estudio efectuado en 22 animates, a once de ellos se les dio proteina de mani crudo y a los 
otros once proteinas de mani tostado. A un nivel del 5%, pruebe la hipotesis de que la proteina de 
mani tostado ha tenido menor efecto sobre el valor proteinico circulante. 


TIPO DE MANI 

PROTEINAS CIRCULANTES (A B) 

a) Crudo 

b) Tostado 

44 63 63 59 61 61 60 56 56 59 56 

61 59 63 55 58 54 47 51 57 54 54 


106. El cuociente de inteligencia de 16 estudiantes de secundaria, jomada noctuma, dio un promedio de 
112 con una varianza de 64, mientras que para 14 estudiantes del mismo colegio, de jomada diurna, 
dio un promedio de 107 con una desviacion estandar de 10. ^Existe una diferencia entre el I.Q. de 
los dos gmpos? 
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107. Con base en los registros de personal, dos grandes compamas toman muestras relativas a la edad 
que se pensiona su personal. En ambas compamas se consideran muestras aleatorias de 25 ex- 
empleados. Las compamas encuentran que: 

=44.500 3c = 40 2>, 2 =78.000 j = 50 (Nivel del 5%) 

/,Cree usted que los empleados de la compama B se pensionan a una edad mayor que los de A? 

108. Un inversionista desea decidir entre dos tipos de valores. Para su decision cuenta con la siguiente 
informacion acerca del rendimiento expresado como porcentaje del precio: 


VALOR A: 

7,9 

8,3 

6,3 

8,2 

7,3 

7,6 

10,3 8,9 

VALOR B: 

9,6 

9,1 

5,8 

10,3 

9,4 

8,2 



/,Sugieren estos datos que el valor B produce mayor utilidad que el valor A? 


109. Una prueba de lectura fue rendida por los alumnos del primer curso de una escuela elemental. El 
resultado consistio en que de 10 alumnos que aprendieron a leer con el metodo A, su promedio fue 
de 3,5 y desviacion tipica de 0,5; con 12 alumnos por el metodo B, su promedio de calificacion fue 
de 3,7 y desviacion estandar de 0,4. ^A1 nivel del 5%, se podria afirmar que el metodo B es mas 
efectivo que el A? 

110. El gerente de una empresa, asegura que su programa de entrenamiento en ventas le permite un 
promedio diario en venta superior a $110,000 por vendedor; selecciona una muestra de 10 agentes 
que han recibido el programa de entrenamiento y obtiene los siguientes resultados (en miles de $): 


100 

90 

120 

130 

130 

110 

125 

122 

115 

135 


a) Si usted fuera el superior de estos agentes, ^adoptaria el programa de entrenamiento propuesto por 
el gerente? (oc = 5%). 

b) Si el verdadero valor promedio diario de ventas de la empresa es de $112,000, £que tipo de error 
se comete, si se docima al 1% que el promedio es diferente? 

c) Si usted selecciona 14 vendedores de la empresa sin someterse a dicho programa de entrenamiento y 
compara dicha muestra con la de los diez (10) que recibieron entrenamiento, ^puede afirmarse, a un 
nivel de significacion del 5%, que dicho programa no produce los efectos que sostiene el gerente? 


80 

110 

130 

115 

120 

110 

100 70 

130 

75 

140 

85 

120 

95 

(miles de $) 


111. Un fabricante registro el numero de articulos producidos diariamente, durante 10 dias, para un grupo 
de 15 obreros que operaban con base en un plan de salarios fijos. El fabricante introdujo un plan de 
incentivos salariales para otros 15 obreros y registro la produccion durante 10 dias. El numero de 
articulos producidos diariamente fueron: 


PRIMER GRUPO: 

75 

76 

74 

80 

72 

78 

76 

73 

72 

75 

SEGUNDO GRUPO: 

86 

78 

86 

84 

81 

79 

78 

84 

88 

80 


Suponiendo que los salarios pagados a cada grupo fueron iguales, ^puede el fabricante concluir que 
el plan de incentivos fue efectivo? 
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112. Una prueba de resistencia al esfuerzo de dos tipos diferentes de cable, se llevo a cabo, seleccionando 
dos muestras de tamanos 15 y 20, respectivamente; las medias fueron de 905 y 925, con desviaciones 
tipicas de 25 y 35. ^Proporcionan estos datos, al nivel del 10%, suficiente evidencia para indicar que 
la resistencia al esfuerzo de los cables de B es superior a la de A? 

113. En un laboratorio de psicologia hicieron llegar, por diferentes conductos, una sustancia toxica hasta 
el sistema nervioso central en varios animales. La variable de interes fue el tiempo, en horas, entre 
la administracion de la toxina y la iniciacion de los sintomas. Se obtuvieron los siguientes datos: 


CONDUCTOS 

n 

X 

VARIANZA 

A 

ii 

40 

10,0 

B 

7 

31 

20,9 


/,Proporcionaran estos datos evidencia como para concluir, en promedio, que la iniciacion de los 
sintomas opero pronto cuando la toxina se administro por el conducto B? (Nivel del 5%). 

DISTRIBUCION DE DIFERENCIAS ENTRE DOS 
PROPORCIONESMUE ST RALES 1 2 

En la aplicacion de estas distribuciones en muestras pequenas, se sigue el mismo procedimiento 
utilizado para muestras grandes, con la diferencia en la presentacion de la formula, en la cual se trabaja 


/ — 

Pi ~ Pi 


IpiVi ! Pi<h 

n x - 1 n 2 - 1 


E jemplo 1 . En una muestra probabilistica de 12 amas de casa, el 20% indico preferencia por la marca A 
de margarina. Con posterioridad a una campana intensiva de radio y television, se selecciono una nueva 
muestra entre amas de casa del mismo tamano y clase social. En esta muestra el 22% indico preferencia 
por la marca A. De acuerdo con estos resultados y a un nivel de 5%, ^podria rechazarse la hipotesis de 
que la campana de publicidad no fue efectiva? 


n x =12 n 2 =12 

P x =0,20 

£ 

II 

£ 

2) oc=0,05 

</l pi 



3) SfA-p2 — 

4) t = 


P\<h , Pi^i 


n { — 1 n 2 -l 

0,2-0,22 


(0,2)(0,8) + (0,22)(0,78) 


12 


12 


p =0,22 


- = - 0,12 


- 1,717 


oc=0,05 



Se ubica - 0,12 en la zona de aceptacion. Al nivel del 5%, se puede rechazar la hipotesis que la 
campana publicitaria no fue efectiva. 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nformadon 
en Lfnea SIL. 

114. El Jefe de cartera de una compama asegura, que utilizando la llamada telefonica logra acelerar 
mas que una carta de cobro, el pago de cuentas morosas. Dos grupos de clientes morosos fueron 
contactados por cada metodo, fijando un plazo no mayor de 10 dias para recibir el pago. En el 
primer grupo conformado por 20 personas, se obtuvieron respuestas de 14: en el segundo grupo, 
se tomaron 16 clientes morosos y solo respondieron 10. ^Aun nivel de significance del 0,01, debe 
concluir la compama que el jefe de cartera tiene razon? 

115. En una empresa se considera que la proporcion de permisos para ausentarse de la oficina en horas 
de trabajo, es mayor en los hombres que en las mujeres. Para comprobar la anterior afirmacion se 
escogio una muestra de 20 hombres y 24 mujeres, observando que el numero de permisos solicitados 
y concedidos fue de 14 y 10 respectivamente. La investigacion se realizo sobre el total de permisos 
en un mes. <^A1 nivel del 5%, es valida la afirmacion? 

116. Un distribuidor de acuerdo a su experiencia, dice que existe igual preferencia por la marca de 
computador que ofrece, dependiendo de la Universidad en la que estudia el consumidor. Con base 
en una muestra aleatoria en 25 alumnos de la primera Universidad, se encuentra que 20 prefieren 
dicha marca, mientras que en una muestra de 16 alumnos en la segunda Universidad, solo 10 la 
prefieren. <yEs aceptable la afirmacion de igual preferencia por la marca del computador? 

117. Una embutidora de came ofrece para el consumo, dos clases de productos diferentes por el contenido 
de grasa. Se tomaron dos muestras teniendo en cuenta la clase del producto, para preguntar si la 
aceptacion dependia del contenido de grasa. En el primero, en una muestra de 16 consumidores, 6 
compraron poco contenido; en la muestra de 10, solo 3 no tuvieron en cuenta el contenido de grasa. 
^Es valida la afirmacion de que la preferencia depende del nivel de grasa? 



gg | APLICACION CON EXCEL _ 

PRUEBA DE IPOTESIS 

Consideremos en primer lugar la aplicacion de Excel en las pmebas de hipotesis, en una distribucion 
de MEDIA MUESTRALES, cuando es bilateral, con un nivel de significance del 5% (a=0.05), para la 
caracteristica que hemos venido utilizando, es decir, CALIFICACIONES obtenidas por los alumnos en 
las pmebas realizadas por el ICFES. La hipotesis nula, es decir, la media poblacional supuesta es de 310 
(p=310), frente a la alternativa de que sea diferente. 

M uestra grande: >30 —> ( ) 

El tamano de la muestra sera de N=80 ubicada en la COLUMNA H, donde la identificacion de la 
variable aparece en la CELDA H2, los datos van desde H3 hasta H82 (Ver Tabla No. 1 en el SIL). 

l)H o : p = 310 2) a = 0,05 

H°: p *310 

a r 

Nota: Ver informacion y todo el proceso en el SIL, segunda parte. 

□ En los procedimientos anteriores, se hara CLIC en la ficha DATOS-ANALISIS DE DATOS 
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Figura No. 1. Analisis de Datos 
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TABLA No. 1 POBLACION (1.100 ESTUDIANTES DE UN CENTRO EDUCATIVO) 


L - 

s 


2 

No. 

Orden 

Facultad 

Sexo 

No. 

Hermanos 

No. Libros 

leidos 

Promedio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

Estatura/Cm 

Peso/Kg 



i 

2 

1 

3 

4 

2,6 

1 

410 

18 

140 

46 


4 

2 

2 

2 

2 

2 

4,1 

1 

360 

20 

158 

48 


~5~1 

3 

1 

2 

4 

6 

3,2 

2 

320 

21 

162 

50 


~6~\ 

4 

1 

2 

3 

2 

3,3 

2 

280 

16 

166 

58 



5 

2 

1 

6 

10 

3,9 

2 

310 

17 

171 

64 


8 

6 

3 

2 

8 

6 

3,6 

2 

290 

17 

146 

66 


9 

7 

1 

1 

1 

2 

3,4 

2 

280 

18 

159 

61 


10 

8 

1 

1 

0 

0 

2,6 

1 

250 

24 

162 

72 


11 

9 

3 

2 

0 

6 

3,4 

2 

320 

20 

170 

70 


12 

10 

3 

2 

1 

3 

3,9 

2 

240 

26 

172 

76 


13 

11 

2 

1 

8 

5 

3,6 

1 

320 

20 

168 

65 


14 

12 

3 

1 

6 

3 

3,6 

2 

330 

18 

174 

78 


15 

13 

2 

2 

4 

3 

3,5 

2 

350 

16 

165 

65 


16 

14 

1 

1 

1 

4 

3,4 

1 

300 

17 

170 

70 


17 

15 

1 

1 

3 

3 

3,7 

2 

310 

19 

172 

76 


18 

16 

2 

1 

0 

4 

3,8 

1 

300 

19 

166 

64 


19 

17 

2 

1 

6 

2 

3,1 

1 

270 

21 

168 

60 


20 

IS 

1 

2 

3 

6 

3,9 

2 

260 

27 

165 

68 


21 

19 

2 

2 

0 

2 

3,9 

2 

290 

26 

171 

66 



1 Hojal , Hoja2 , Hoia3 , tJ 


< 


Promedio: 3,293076923 Recuento:30 Sums: 85,62 I 


—D- 


mtamno'mJT & * 
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□ 

□ 


Seleccionamos ESTADISTICA DESCRIPTIVA y hacemos CLIC en ACEPTAR. 

En el cuadro desplegable ESTADISTICA DESCRIPTIVA, teclearemos en la primera casilla 
RANGO DE ENTRADA H2:H82. 

Seleccionamos ROTULOS EN PRIMERA ENTRADA, lo mismo en lo que respecta a 
RESUMEN DE ESTADISTICA, haciendo CLICK en ambos casos. 

Establecemos el RANGO DE SALIDA, tecleando por ejemplo N3 y luego haremos CLIC en 
ACEPTAR, tal como se puede observar a continuacion: 


Figura No. 2. Estadistica Descriptiva. 
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H2 
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|* 


F G 

H 1 | J 

K L 

M N 

I_°_L_ 

P 


1 ION (1.100 ESTUDIANTES DE UN CENTRO EDUCATIVO) 


“0 


2 

Promedio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

Estatura/Cm 

Peso 

1 

3 

2,6 

1 

410 

18 

140 


4 

4,1 

1 

360 

20 

158 


5 

3,2 

2 

320 

21 

162 


6 

3,3 

2 

280 

16 

166 


7 

3,9 

2 

310 

17 

171 


8 

3,6 

2 

290 

17 

146 


9 

3,4 

2 

280 

18 

159 


10 

2,6 

1 

250 

24 

162 


11 

3,4 

2 

320 

20 

170 


12 

3,9 

2 

240 

26 

172 


13 

3,6 

1 

320 

20 

168 


14 

3,6 

2 

330 

18 

174 


15 

3,5 

2 

350 

16 

165 


16 

3,4 

1 

300 

17 

170 


17 

3,7 

2 

310 

19 

172 


18 

3,8 

1 

300 

19 

166 


19 

3,1 

1 

270 

21 

168 

61 

20 

3,9 

2 

260 

27 

165 

61 

21 

3,9 

2 

290 

26 

171 

61 


►i 1 Hojal , Ho]a2 , Hoja3 , 


Estadistica descriptiva 


TUB 


Rango de entrada: 


0 Rotulos en la primera fila 


© Columna 
O Ellas 


|$N$3 


Opciones de salida 
© Rango de salida: 

O En una hoja nueva: 

O En un libro nuevo 
0 Resumen de estadisticas 
0 Nivel de confianza para la media: 

0 K-esimo mayor: J_ 

0 K-esimo menor: 


lL 


Promedio: 2191,068565 Recuento:27 Suma: 28483,89134 iQ| 100% 
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Figura No. 3. Cuadro de Resultados. 
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□ El valor de la MEDIA ARITMETICA ( X ) aparecera en la CELDA N5 acompanada de 
resultados, correspondientes a otras medidas. 

□ Ahora procedemos a seleccionar la CELDA Oil en la cual tecleamos la formula =N5-310/N6. 


Figura No. 4. Calculo del Valor Z 
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La formula estadistica que se utilizo para el calculo es: Z = 
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Los resultados obtenidos, seran utilizados para ser reemplazados en la formula 


Siendo 


1309 . 9-3101 

42,49 

V80 


4,75 


0,022 


j=3Qg9 ^ = 4,75 fl— 310 

s[n 

El resultado de Z sera aproximadamente igual a - 0,022 



Observamos que - 0,022 cae en la region aceptable o zona de aceptacion, lo que indica que estare- 
mos aceptando la hipotesis nula (H 0 ). 

M uestras peque as < 30 (t) 


Corresponde a muestras de H < 30 y la prueba con aplicacion de EXCEL, es casi igual al procedi- 
miento indicado para muestras grandes (D > 30), tal como se vera a continuacion 


H 0 :jll =310 
H a :|i ^310 


a = 0,05 


t = 


x-|i 


S 

J7T 


□ Hacemos CLIC en ANALISIS DE DATOS de la ficha DATOS-ESTADISTICADESCRIPTIVA. 

□ En el RANGO DE ENTRADA solamente tomaremos los primeros 20 datos de la variable 
CALIFICACIONES ICFES, siendo H2 el tltulo de la columna y de H3:H22 el rango de datos 
a seleccionar. 

□ Seleccionamos ROTULO PRIMERA FILA y RESUMEN DE ESTADISTICA. 

□ Establecemos el RANGO DE SALIDA, en nuestro caso sera M3. 

□ Finalmente hacemos CLIC en ACEPTAR. 


Nota: En la segunda parte del SIL se encuentra la Tab la No.l con la informacion completa incluida la 
columna de CALIFICACIONES ICFES. 
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Figura No.5. Seleccion de Analisis de Datos. 
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Figura No.6. Estadistica Descriptiva - Datos de la Muestra. 
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Figura No. 7. Cuadro de Resultados. 
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Como se puede observar, el cuadro de resultados aparece a partir de las celdas M5 y N5. Por 
ejemplo, para el caso de la MEDIA MUESTRAL, este aparece en la Celda M5 y su valor 
corresponde a 320.69 ubicado en la celda N5. 

Finalmente, seleccionamos la CELDA P5 y en ella tecleamos la formula t=(N5-310)/N6, en la 
CELDA P5 debe aparecer el valor estadistico de "t". 


Figura No. 8. Calculo del Valor del Estadistico t. 
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Siendo: 



(320.33-310) 

47.30 

V20 


10.33 

8,63 


1,19 


Se concluye aceptando la hipotesis nula H 0 , ya que 1,19 cae en la zona de aceptacion 



PRUEBA IPOTESIS ENTRE DOS MEDIAS M UESTRALES 

Ho: (4-310 0,05 

Ha: (.t =£ 3 10 

M uestras grandes (z) 

Digitamos la siguiente informacion en una hoja de calculo, correspondiente a dos (2) muestras de 
tamanos ri ] = 32 y n 2 = 40 acerca de la duracion en miles de kilometres de dos (2) marcas de llantas para 
automoviles. 




Figura No.9. Informacion Digitada en Hoja de Calculo. 
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Figura No. 10. Analisis de Datos. 
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□ Seleccionamos la ficha INSERTAR-ANALISIS DE DATOS. 

□ En ANALISIS DE DATOS elegimos PRUEBA Z PARA MEDIAS DE DOS MUESTRAS y 
hacemos CLICK en aceptar. 

□ En los campos correspondientes a RANGO PARA LA VARIABLE, elegimos los datos de las 
celdas Marca A y Marca B segun sea el caso. 

□ Dado que la hipotesis nula planteada corresponde a Ho: jli , es decir, que \i- p = 0 por lo 

tanto en el espacio dado para DIFERENCIAHIPOTETICAENTRE LAS MEDIAS, tecleamos 
0. 

□ En este procedimiento se considera que las varianzas poblacionales estimadas que sirven a los 
campos VARIANZA PARA LA VARIABLE 1 y 2 son: o x 2 = 65,36 y a 2 = 51,82. 

□ Procedemos a seleccionar ROTULOS. 

□ En cuanto al nivel de significance casi siempre se trabaja con un nivel del 5% que corresponde 
al valor que vamos a digitar en el campo sugerido para ALFA. 

□ Finalmente seleccionamos el RANGO DE SALIDA, en nuestro caso corresponde a la CELDA 
C3. 
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Figura No. 11. Prueba Z para Medias de Dos Muestras 
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Figura No. 12. Cuadro de Resultados. 
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Como Z es igual a 6.87, cae en la zona de rechazo, por lo tanto al nivel del 5% rechazamos H q . Es decir, 
que las llantas para automoviles presentan una duracion diferente en kilometros segun la marca. 



Tomando como base la tabla propuesta del ejemplo anterior y seleccionando solo n= 12 y r) 2 =16, de los 
datos alii incluidos, desarrollaremos ahora la prueba bilateral para pruebas pequenas. 

Ho: 0=0.05 

Ha: \l x * 

□ Se calcula una VARIANZA MUESTRAL para ambas muestras tal como se presenta en el 
proceso siguiente. 

□ En la Ficha DATOS-ANALISIS DE DATOS seleccionamos la funcion PRUEBA "t" para media 
de dos (2) muestras suponiendo varianzas iguales. 



Figura No. 13. Analisis de Datos 
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□ En el cuadro de dialogo que aparece, se establece en los dos primeros campos la seleccion de 
cada una de las columnas utilizadas para este ejemplo, en este caso, primero seleccionamos 
el rango de datos de la columna A denominada Marca A y luego el rango correspondiente a la 
columna B que denominamos como Marca B. 

□ La hipotesis nula (H 0 ) corresponde a \i x - p = 0, por lo tanto tecleamos cero (0) en el campo 
DIFERENCIA HIPOTETICA ENTRE LAS^MEDIAS. 

□ Se preselecciona ROTULOS. 

□ En la casilla ALFA digitamos 0.05, dado que el NIVEL DE SIGNIFICACION sera oc - 0,05. 

□ Finalmente procedemos a seleccionar el RANGO DE SALIDA, en nuestro caso tecleamos 
la celda D3 en la casilla correspondiente y hacemos CLIC en ACEPTAR, obteniendose el 
resultado para t. 


Figura No. 14. Prueba t para Dos Muestras 
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■ En la SEGUNDA PARTE del SIL que acompana al libro, encontrara en conjunto toda la aplicacion 
del EXCEL a la Estadfstica, que igual al capftulo 13, ofrece una BASE DE DATOS para trabajar. 
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FiguraNo. 15. Cuadro de Resultados. 
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LIMITESDE CONFIANZA 


Se habla con frecuencia de limites de probabilidad, siendo dos valores (superior e inferior) asignados a 
un valor estimado, con el objeto de establecer el intervalo dentro del cual se supone esta comprendido el 
valor verdadero (parametro) conforme a algun valor de caracter probabilistico, generalmente denominado 
n ivel de confianza. 

Los limites de confianza se tendra los valores Z s y Z. cuando la muestra es grande, (tambien t s 
y t. cuando la muestra es pequena) que forman los extremos superior e inferior respectivamente de los 
intervalos de confianza, con respecto a un valor puntual. 

L § = Z § = Limite superior L. = Z. = Limite inferior del intervalo 

Recordemos que en alguna oportunidad se hablo de dos tipos de estimacion: puntual y por interva¬ 
los. El primero, corresponde a un solo valor o pun to que resulta de una investigacion por muestreo, como 
por ejemplo, la media aritmetica, una proporcion, una razon, etc. A1 realizar una muestra, se obtienen 
conclusiones sobre la poblacion, mediante la utilizacion de alguna medida de posicion o de dispersion, 
pero este valor puede ser igual o diferente al del parametro. Por lo tanto se debe establecer dos puntos, 
dentro de los cuales estara el parametro con cierto grado de confiabilidad. 


Ejemplo 1. El propietario de una pequena fabrica de artesanias, toma una muestra aleatoria de la 
production semanal de 6 de los 35 empleados, obteniendo un promedio de 22,5 figuritas, con una 
desviacion estandar de 3,1. 
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Encontramos que el estimador es de 22,5, el cual puede ser igual o diferente del promedio (para- 
metro), considerando un total de 35 empleados. Para muchos, es mas facil y mas representativo 
fijar los llmites de confianza para ese estimativo, con la probabilidad que se considere conveniente, 
supongamos del 95%. Por lo tanto se tendran, partiendo de la variante estadlstica, los llmites de 
confianza para ese estimativo, con la probabilidad mas indicada, generalmente del 95%. Su formula 
se obtiene, partiendo de la variante estadistica, en este caso “t”: 


x-ju 
s/yfn -1 


despejando: 


jU = X±t 


V«-l 


reemplazando: 


H = 22,5 ±2,571 


jU 

-v/6 


22,5 ±3,25 


25,75 = M 
19,25 =M 


superior 

inferior 


Se tendran dos limites u . = 25,75 y u., . = 19,25. Con estos resultados se dira que la produc- 
cion real semanal por empleado debe estar entre 19 y 26 figuras, con una seguridad o confianza del 95%. 
Observamos que nos queda un 5% considerado como error, de tal manera que el promedio de figuras por 
empleado puede ser superior a 26 o inferior a 19. La media poblacional debera estar incluida (en algun 
punto) dentro del intervalo. 

Podria preguntarse ^por que se toma 90%, 99% y no el 100% de confianza? Se puede responder al 
interrogante con el anterior ejercicio, observemos que a medida que se aumenta el nivel de confianza, 
mas amplio va a ser el intervalo, con lo cual se obtendria una informacion menos precisa y menos util. 


Con los intervalos de confianza pueden realizarse pruebas de hipotesis, teniendo en 
cuenta que la prueba debe ser siempre bilateral Si la hipotesis nula (Ho) se ubica 
dentro del intervalo, se acepta; en caso contrario, se aceptara la altemativa (Ha). 


DISTRIBUCION DE M EDIAS M UESTRALES 


Con las siguientes formulas se pueden determinar los limites de confianza para cada caso, dependiendo 
de la desviacion tipica y del tamano de la muestra, son: 


Ms = x ± z - 7 = 
r V n 

Cuando 
se da <7 


Ms =x±Z-?= 
r ^In 


se tiene s 
y n >30 


Ms =*±*- 7 = 

? V n 
se tiene 

S (corregida) 

y n< 30 



E jemplo 2. Un muestra de 50 observaciones tiene una media de 65 y una desviacion estandar de 4,2. Se 
piden limites de confianza del 95%. 
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4 2 0 9500 

ju % = 65 ± 1,96 -fL; = 0,4750 

/ V50 2 

Z (0,4750) —>1,96=Z 
Z = 1,96 


Ms =x±Z-^j= 
t sin 


ju s = 65 ± 1,96 = 65 ± 1,96 (0,59) = 65 + 1,16 

/ 7,07 




66,16 

63,84 


Ejemplo 3. Una muestra de 26 observaciones tiene una media de 65 y una desviacion de 4,2. Se piden 
limites de confianza del 95%. 


o 


x = 65 


Ms= x±t ~j= 
i sjn-l 


fi s = 65 ±2,0595 
/ 


4,2 

425 


5=4,2 


ju, = 65 ±2,0595(0,84) =65 ± 1,73 

/ 


EJERC 1C IQS PARA RESOLVER 


95 % 



- 2,0595 0 2,0595 


J 66,73 
(63,27 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor macion 
en Lfnea SIL. 


118. Si se obtienen todas las posibles muestras de tamano 25 en una distribucion normal con media 20 y 
desviacion estandar 4, ^dentro de que limite se encuentra el 90% central de las medias muestrales? 

119. Suponga que la estatura media de los hombres tiene una desviacion estandar de 2,48 centimetros. Se 
miden 100 estudiantes, hombres, elegidos aleatoriamente y se obtiene una estatura media de 168,52 
centimetros. Determine los limites de confianza del 99 % para la estatura media de los hombres de 
esta universidad. 

120. En una muestra de 60 observaciones, la media es 35 y la desviacion estandar, 4,2. Obtenga los 
limites entre los cuales debe encontrarse la media poblacional, con una probabilidad del 95%. 

121. Una muestra de 36 observaciones tiene una media de 40yuna desviacion estandar de2,l. Encuentre 
los limites de confianza del 95% para la media de la poblacion. 

122. Una muestra de 80 laminas de hierro galvanizado, con la cual determinamos su peso, con una media 
de 4,82 onzas y una desviacion tipica de 0,1 onzas. Calcular los limites de confianza, al nivel del 90%. 

123. Un fabricante de metros metalicos, con el fin de controlar la exactitud de los mismos, tomo una 

muestra de 10 de ellos y los midio con toda precision. Las medidas obtenidas fueron: 0,99 1,04 

0,98 0,97 1,02 1,01 0,99 0,95 1,03 y 1,02 metros. Estime con un 90% de confianza los limites 
para la media problacional. 
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124. Quince trozos de alambre de cobre tornados de 15 rodillos de alambre tienen las siguientes medidas 
de resistencia a la rotura (medida en libras): 1.672 2.854 1.680 1.570 2.020 1.568 872 980 
1.080 870 896 812 930 850 864. Calcular los limites de confianza con un 95%, para la media 
de la poblacion. 

125. Las determinaciones quimicas del porcentaje de hierro de 15 minerales de un deposito elegido 
al azar, dieron un promedio de 38,2% y una desviacion tipica del 5,2%. Establecer los limites de 
confianza con un 99%, para el porcentaje medio de hierro en el deposito. 

126. Una muestra de 14 observaciones tiene una media de 34,86 y una desviacion estandar de 4,23. 
Encuentre los limites que en el 95% de los casos permiten acertar, al afirmar que la media poblacional 
queda incluida entre ellos. 

127. En una muestra de 23 observaciones, la media es 26,3 y la desviacion estandar 1,9. Obtenga los 
limites de confianza del 99% para la media poblacional. 

128. Encuentre los limites de confianza del 90% para la media de una poblacion normalmente distribuida, 

con desviacion estandar 3,83, si una muestra obtenida en dicha poblacion presenta los siguientes 
valores: 18,5 20,6 12,9 14,6 19,8 15,0. 

129. En una muestra de 5 articulos se ha obtenido, al nivel del 95%, que los limites de confianza para peso 
de todos los articulos embarcados, son de 12,39 y 17,11 onzas. Obtenga la media y la desviacion 
estandar de dicha muestra. 

130. Los pesos netos, en onzas, de una muestra aleatoria de 8 tarros de cerveza, son los siguientes: 


12,1 

11,9 

12,4 

12,3 

11,9 

12,1 

12,4 

12,1 


a) Encuentre los limites de confianza del 99% para el peso medio por tarro de cerveza correspondiente 
a la poblacion de la cual se obtuvo la muestra. 

b) Empleando el resultado obtenido, senale en esta muestra (al nivel del 1%) que se mantiene la 
produccion corriente de 12,35 onzas de promedio por tarro. ^Explique su respuesta? 

131. Un sondeo efectuado a 400 familias de clase media revelo un gasto trimestral promedio de $374,000 
en productos de tocador, con desviacion de $80,000. 

a) Determine un intervalo de confianza del 95%. 

b) ^Cual es el maximo error, cuando se afirma que dicha media es de $374,000, con una confianza 
del 99%? 

132. En una muestra de tamano 10, tomada de una poblacion normal, los limites de confianza del 90% 
para la media de la poblacion son x± 5,2 se pide determinar la desviacion estandar de la poblacion. 

133. Supongamos que un grupo de medicos ha establecido, que si los cigarrillos contienen por termino 
medio, 30 miligramos o mas de nicotina, es seguro que se produce cancer de pulmon en el fumador. 
Un ensayo sobre 100 cigarrillos de la marca A, muestra que x = 26 miligramos de nicotina. Si se 
sabe que a = 8 miligramos, a) calcular el intervalo de confianza de 99% para el consumo medio de 
nicotina de la marca A de cigarrillos. b) El fumador esta dispuesto a correr el riesgo si la media es 
diferente de 30, ^Que decision tomaria al nivel del 1%? 
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134. El salario medio mensual para una muestra de 30 operarios textiles es de $612,000, con una varianza 
de $935,000. Fije los limites de confianza del 95% para el salario medio mensual de los operarios 
en fabricas de textiles. 

135. Se prueba una muestra aleatoria de 8 fusibles de una cierta marca, para determinar el punto medio 
de ruptura. Los puntos de ruptura medidos en amperios fueron: 


24 

18 

22 

14 

26 

20 

22 

19 


a) Fije los limites de confianza del 99% 

b) A1 nivel del 1%, podria afirmarse que estos resultados son diferentes a los senalados por la 
empresa, de 22 amperios de punto medio de ruptura? 


136. Una muestra aleatoria de 18 operadoras de maquinas perforadoras en bancos comerciales de una 
ciudad, da la siguiente informacion: 

X = Salario por semana de una operadora; 

X x. = $2,700,000 £ ( X/ - x) 2 = 1.351.000 

a) Obtengase un intervalo de confianza del 95% para estimar el salario medio por semana de los 
operadores de maquinas perforadoras empleadas por los bancos comerciales de dicha ciudad. 

b) Aun nivel del 5%, ^podria afirmarse que el promedio de salarios por semana es de $152,000. 

c) Si se sabe que el verdadero promedio de salario semanal es de $160,000, ^que tipo de error se 
estaria cometiendo? 

137. Una muestra de 9 frascos de cafe instantaneo, seleccionados de un proceso de produccion, dio los 
siguientes valores para el contenido, medido en gramos: 


285 

291 

265 

270 

279 

288 

290 

279 

284 


a) Obtengase un intervalo de confianza del 95%, para estimar el peso neto de los frascos de cafe 
instantaneo. 

b) Por larga experiencia, se sabe que el contenido promedio es de 280 gramos. Pruebe, al nivel de 
5%, si es cierto. 

138. El departamento de transito y transporte llevo a cabo un estudio sobre velocidad a la que conducen 
los automovilistas en una autopista durante las primeras horas de la manana (2 am - 6 am). Durante 
el tiempo de estudio se detecto que 100 automoviles tuvieron un promedio de velocidad de 120 
km/h con una desviacion estandar de 25 km/h. 

a) Estime la media verdadera. 

b) Establezca un intervalo de confianza del 98% para la media de la poblacion. c ) Pruebe al nivel 
del 2% que el promedio de velocidad es diferente al de 100 km/h fijado para esa via, durante ese 
periodo. 


DISTRIBUCION DE ME DIAS PROPORCIONALES MUE ST RALES 


z= p zL 

M 

se despeja P 6 Up para obtener 


V n 




De la formula 
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Y el procedimiento de calculo es casi similar al utilizado en las Medias muestrales. Veamos algu- 
nos ejemplos que ayudaran a establecer los limites de confianza, tanto para Z cuando la muestra es 
grande (n > 30) y "t cuando es pequena (n < 30): 

E jemplo 1. Una muestra de 100 votantes elegidos al azar entre los habitantes de un barrio, indicaba que 
el 45% de ellos estaban a favor de un candidato. Hallar los limites de confianza del 95%. 


u p = 0,45 ± 1,96 


0,45(0,55) 


100 


0,45 ± 0,10 


^ 0,55 
^ 0,35 



E jemplo 2. Una investigacion efectuada a 400 familias de clase media revelo que en la realizacion de 
fiestas familiares, un 62% preferia el aguardiente a cualquier otra clase de licor. Determine los limites de 
confianza del 99%. 



Ejemplo 3. Una compania asegura que el 80% de sus semillas de zanahoria germinan. Se plantan 50 
semillas de las cuales 8 no germinan. 

a) Hallese un intervalo de confianza del 90%, para la proporcion de semillas que germinaron en la 
muestra 

b) Con base en lo anterior docime, al nivel del 10%, lo que afirma la compania. 


o 

a) p = l~q /> = 1-J- = 1-0,16 = 0,84 



VC 

d 

'nT 

d 

0, 26 

M, P = 0, 4 ±1,65^| 

50 =u ’ 4±0 ’° 

6 ^ 0,754 

b) 1) H 0 : |i p =0,80 

2) oc= 0,10 

3) S p =0,052 

H-. Mp *0,80 




Se puede aceptar lo ofrecido por la empresa, ya que 0,80 se encuentra dentro de los limites de con¬ 
fianza, por tal motivo se acepta la hipotesis nula, al nivel del 10%. 

E| ERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Si Sterna del nfor mad on 
en Lfnea SI L. 



139. Una muestra al azar de 5.000 casas en una ciudad, indica que 188 estaban desocupadas. Estime la 
proporcion de casas desocupadas en la ciudad, con un nivel de confianza del 90%, del 95 y del 99%. 
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140. En una muestra al azar de 826 telefonos de residencias del directorio de Medellin, 95 no respondieron 
a la llamada entre 7 y 8 de la noche, el dia que se realizo la muestra. Determinar los limites de 
confianza del porcentaje de suscriptores en cuyas residencias hubo alguien entre 7 y 8 de la noche. 
(Se admite que no se contesto porque no habia nadie en casa). El nivel de confianza adoptado es 
del 90%. 

141. Un fabricante de maquinas de afeitar desechables, solicita que se haga una investigacion de 
mercados, tomando una muestra de 100 personas empleadas del sector publico, obteniendose que 
el 60% prefieren esa marca y tipo de maquina. Con la anterior informacion se pide. 

a) Fijar los limites de confianza del 99%, de las personas que prefieren esta maquina. 

b) El fabricante estima que el 62% de los empleados publicos prefieren dicha maquina; se pide, al 
nivel del 1%, probar la hipotesis de que tiene razon. 

c) Si el porcentaje verdadero de preferencia es del 65%, determinar que tipo de error se esta 
cometiendo. 

142. En una encuesta de opinion publica, 640 personas de un total de 800, se pronunciaron en favor de 
cierto producto. 

a) Establecer un intervalo de confianza del 99%, para estimar la proporcion de personas que estan 
a favor de este producto. 

b) Si el productor afirma que el 85% de la opinion es favorable, ^se puede aceptar dicha aseveracion 
al nivel del 1%? 

c) ^Con que grado de confianza, puede afirmarse que la proporcion de personas que estan a favor 
del producto se situa entre 77% y 83%? 

143. Una muestra aleatoria de 100 clientes que realizan sus compras entre las 12 a.m y 2 p.m, revela que 
todos, excepto 15, incluyen la leche en sus compras. 

a) Establezca un intervalo de confianza del 90%. 

b) A nivel del 10% y de acuerdo con los resultados del punto (a) ^se podra afirmar, que el porcentaje 
de personas que incluyen leche en sus compras es diferente al afirmado por el gerente, quien 
asegura que es del 80%? 

144. En un barrio de la ciudad se efectua un muestreo para determinar la proporcion de familias que poseen 
un televisor a color. La muestra de tamano 80 indica que 52 tienen television a color. 

a) Establecer un intervalo de confianza del 95%, para estimar la proporcion de familias que poseen 
televisor a color. 

b) Si una informacion dada por la Camara de Comercio afirma que de 1.000 familias, 560 poseen 
televisor a color, pruebe esta afirmacion al nivel del 5%. 

DISTRIBUCION DE DIFERENCIA ENTRE DOS MEDIAS MUESTRALES ( ) 

Se presentan en resumen, formulas que deben ser aplicadas de acuerdo al enunciado del problema, dado 

que cada uno de ellos tiene informacion diferente. 


f^x-y /fr Tfv 


(x-y)±Z. 



Cuando se conoce O x y O y 
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^ =(*-y)± 


n\+n 2 -2 V n x n 


2 2 


/**-? = (*-y)±tJir+zr 


n \ n 2 


s i = iM-xy +£(+,-;+ 

n x + n 2 ~ 2 


Si se tiene s £ y s y ; 
ademas y « 2 
son mayores de 30 


Se tiene ^ y ^ 
(ambas sin corregir) 
ademas n x y n 2 
son menores o 
iguales a 30 


Cuando n x y n 2 <30 


E jemplo 1. En un experimento llevado a cabo para medir la efectividad de dos abonos en dos parcelas, de 
10 hectareas cada una cultivadas con maiz, se obtuvieron las siguientes medias, para la primera parcela 
abonada con el producto A, 81,7 cargas por hectarea; en la segunda parcela, 88,3 cargas por hectarea con 
el B y las desviaciones tipicas de 0,7 y 0,8 respectivamente. ^Cuales son los limites de confianza para la 
diferencia de los promedios con una probabilidad del 95%? 


o 

n x -10 n 2 -10 x = 81,7 y = 88,3 s x = 0,7 s v = 0,8 


(81,7-88,3) ±2,10. 


9(0,49)+ 9(0,64) 
10 + 10-2 


J-+J- 
10 10 


=- 6,6 ± 2,10 

/ 


4,41 + 5,76 


18 


lh-y % = -6,6 ± 2,1 Oyj (0,565) (0,20) 

) 



- 2,10 0 2,10 


=-6,6 ±2,10 (0,34)=-6,6 ±0,71 

) 




-5,89 

-7,31 


Ejemplo 2. Pruebas de resistencia en dos tipos de generos de lana dieron los siguientes resultados (en 
libras por centimetro cuadrado). 


TIPOI: 

138 

127 

134 

125 



TIPO H: 

134 

137 

135 

140 

130 

134 


Determinar los limites de confianza del 95% 
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o 


A 


x f —x 

(x, - x) 2 

y t -y 

(y,-y ) 2 

138 

134 

1 

49 

-l 

i 

127 

137 

-4 

16 

2 

4 

134 

135 

3 

9 

0 

0 

125 

140 

-6 

36 

5 

25 


130 



-5 

25 


134 



-1 

1 

524 

810 

0 

110 

0 

56 


*=^ = 131 

4 


jj=810=135 

6 


s 2 = 110 + 56 = 20>7 5 


= ^75 + 2(^75 = a/5,19 + 3,46 = V8^5 = 2,94 


A,-, = (131 -135) ± 2,306 (2,94) = -4 ± 6,78 _ 1 


Ejemplo 3. Se someten a una prueba 45 alumnos de un curso de estadistica, para determinar las 
diferencias de rendimiento entre hombres y mujeres. Las 20 mujeres tienen un puntaje medio de 60 con 
una desviacion estandar de 19 y los 25 hombres, una media de 66 con una desviacion estandar de 16. 
^Cuales son los limites de confianza del 99%, para la diferencia entre los puntajes medios de los hombres 
y las mujeres? 


o 



h-y 


| (20-1)361+ (25-1)256 
20 + 25-2 


i + i = 5 - 22 


A.v-V, =(.X~y)±tSx-y 

) 


ju^y= -6 ± 2,695 (5,22) = -6 ± 14,07 

) 


^ 8,07 

^-20,07 


E| ERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nfor mad on 
en L inea SI L. 


145. Apartir de dos muestras obtenidas de dos poblaciones normalmente distribuidas se obtuvieron los 
siguientes datos: 
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MUESTRA A: 

n, = 10 lx, =21 £x 2 = 92 

MUESTRA B: 

n 2 = 16 St, =32 Zt 2 =!36 


Encuentre el intervalo de confianza del 95%, para la diferencia entre las medias poblacionales. 


146. En dos muestras se obtienen los siguientes datos: 


x = 75 

y = 60 

n x =36 n 2 = 64 

X(x,-x) 2 

= 1.482 

Z(y,-y) 2 = 1.830 


Encontrar los limites de confianza del 98%, para la diferencia entre las medias de las poblaciones 
de donde se seleccionaron las muestras. 

147. Se utiliza una escala especial para medir las actitudes de un grupo de hombres y mujeres, con 
respecto al aroma de cierta marca de desodorante personal. Mientras mas altos son los puntos, mas 
favorable es la actitud hacia el aroma. Una muestra de 9 hombres, arroja una media de 5 puntos y 
una desviacion tipica de 2,83 y otra muestra del mismo tamano, aplicado en mujeres, presento un 
puntaje medio de 7,5 y una desviacion tipica de 2,27. 

a) Fije los limites de confianza del 95% 

b) Con los datos anteriores, docime si la actitud de las mujeres hacia el aroma es diferente a la de 
los hombres, (5%). 

148. a) Construya un intervalo de confianza del 99%, para estimar la diferencia entre las medias 
problacionales, basado en dos muestras cuyos resultados fueron: 

n t = 9 £x ( .=360 S x = 6 fl 2 = 20 =960 S 2 = 100 

b) Docime si la diferencia es significativa utilizando un nivel de significacion del 1%. 

149. Se hizo una entrevista a siete (7) subdirectores y a cinco (5) analistas de mercado de una gran 
empresa. Se les pregunto a cada uno sobre el porcentaje optimo de cobertura de mercado para su 
compania. Se obtuvieron las siguientes respuestas: 


SUBDIRECTORES: 

25,0 

31,3 

27,8 

20,3 

24,2 

22,5 

26,3 

ANALISTAS DE MERCADO: 

23,1 

28,6 

24,2 

23,5 

26,3 




a) Establezca limites de confianza del 95% 

b) Al nivel del 5%, ^sugieren estos datos que los subdirectores y los analistas estan en desacuerdo 
cuando estiman la cobertura optima de mercado para la empresa? 


150. El advenimiento de materiales sinteticos tales como nylon, poliester y latex, y su introduccion al 
mercado ha suscitado debates acerca de la calidad y resistencia de estas fibras comparadas con las 
fibras naturales; se seleccionaron 10 fibras sinteticas y 10 naturales, siendo: 
x = 272 g S 2 = 1.636 g 2 = 335 kg S 2 = 1.892 g 2 

a) Encuentre un intervalo de confianza del 95% para la diferencia en resistencia media entre la fibra 
sintetica y la natural. 

b) Al nivel del 5%, ^se podra aceptar una diferencia entre la resistencia media de estas fibras? 
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151. El auditor de un banco toma dos muestras, una de 41 cuentas corrientes y otra de 35 cuentas de 
ahorro, para estudiar el saldo al finalizar un ano, encontrando lo siguiente: 


MEDIAS 

CUENTAS CORRIENTES 

CUENTAS DE AHORRO 

Saldo promedio (en miles) 

800 

1.200 

Desviacion tipica 

150 

200 

No. de personas con cuentas 
con mas de dos (2) anos 

41 

35 


a) Hallar intervalo de confianza del 98% para el saldo promedio de cuentas corrientes. 

b) ^Se puede aceptar al nivel de 1%, que el saldo promedio de las cuentas de ahorro es mayor a 

$ 1 , 000 , 000 ? 

c) ^Se puede aceptar que la proporcion de los que tienen cuenta corriente hace mas de dos anos es 
mayor del 50% al nivel del 5%? 

d) ^Se puede aceptar, al nivel del 5%, que la variabilidad en los saldos de cuentas corrientes es 
diferente a la de las cuentas de ahorro? 

e) ^Se puede aceptar al nivel del 5%, que el saldo promedio de las cuentas corrientes es menor que 
el de las cuentas de ahorro? 


152. Los estudiantes que se matricularon en un curso de investigacion educativa fueron distribuidos 
al azar en dos grupos. El grupo A conformado por 10 alumnos, utilizo numerosas tecnicas y 
actividades para enriquecer el curso, obtuvo como rendimiento una calificacion promedio de 4 y 
una desviacion tipica de 0,4; mientras el grupo B, estudio mediante el metodo tradicional de apuntes 
y conferencias, conformado por 12 alumnos tuvo un rendimiento con promedio de 3,6 y desviacion 
tipica de 0,03. Construir el intervalo de confianza del 95%. 


DISTRIBUCION DE DIFERENCIA ENTRE DOS PROPORCIONES 
MUESTRALES 2 


Generalmente se aplican dos formulas, dependiendo del tamano de las muestras, estas son: 


P 2 ) ±f j 


P\q\ ! p 2 q 2 

n x — 1 n 2 -1 


Pp t ~P2 =(j> l -P 2 )±Zy 


[a? 1 ! Pi<h 

J n \ n 2 


Cuando n x y n 2 < 30 


Cuando n x y n 2 > 30 


Ejemplo 1 . En una muestra al azar de 200 adultos y 300 adolescentes que veian cierto programa de 
television, 50 adultos y 150 adolescentes dijeron que les gustaba. Hallar los limites de confianza del 95%, 
para la diferencia de proporcion de adultos y adolescentes que ven television. 



Pi = = 0,25 


Pi — 


200 

150 

300 


= 0,50 
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Mp,-n, =(0,25-0,50) ±1,95 


0,25(0,75) 0,5(0,5) _ +n0 o^ 

200 + 300 “ _0 ’ 251 °’° 8 ^ 


-0,17 

-0,33 


E jemplo 2. Se desea determinar si hay alguna diferencia significativa, segun el sexo, en la preferencia 
por margarina o mantequilla. Se realizo una muestra aleatoria entre 26 hombres y 18 mujeres, indicando 
que 16 y 10 respectivamente, preferian la margarina a la mantequilla. 

a) Establezca limites de confianza del 95% para estas diferencias 

b) Pruebe la hipotesis de que la diferencia es significativa, al nivel del 5%. 


o 


p =1^ = 0,62 p =i§ = 0,55 v = 26+ 18-2 = 42 °c=0,05 

i 26 2 ig 


M Pi - P2 =(0,62-0,55) ±2,018. 


0,62(0,38) , 0,55(0,45) _ nnnj _ n „^, 0,38 


25 


- + - 


17 = 0,07 ± 0,31 o , 4 


H 0 :P l =P 2 oc=0,05 

H a :P^P 2 

P 1 - P 2 = 0 ; el cero esta dentro de los limites de confianza, por lo tanto aceptamos H 0 , es decir, no 
hay diferencia en la preferencia de acuerdo al sexo, al nivel del 5%. En este caso hemos utilizado 
“t” para muestras pequenas. 


Ejemplo 3. En una universidad de Bogota se toma una muestra aleatoria de 600 mujeres, 300 de las 
cuales indican que estan a favor de la supresion de los examenes preparatories y la sustentacion de tesis 
en publico. En una muestra de 400 hombres, 240 indican que estan a favor de lo mismo. 

a) Construya los limites de confianza del 95%, para la diferencia en las proporciones de todas las 
alumnas y alumnos, que estan a favor de la supresion de los preparatories y sustentacion. 

b) Docime al nivel del 5% si la diferencia entre las proporciones es significativa, para ello utilice el 
punto (a). 


4 =IH 50 


s =ir 0 ' 60 


a) „,- n =(0,50 - 0,60)±l,9 5 Jffl?P + < 0 ' 6) < 0 ' 4) 


b) H 0 :p Pi =p Pi 

H a -M Pl ±M P2 


600 400 

oc= 0,05 


-0,10 ±0,0622 


» -0,0378 
-0,1622 


V,-p 2 


= 0,032 


/ip x -iup 2 = 0 no se ubica dentro de los limites de confianza y se rechaza la hipotesis nula, es decir, que 
la diferencia entre las proporciones es significativa, al nivel del 5%. 
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EJERC 1C IQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de I nformacion 
en Lfnea SIL. 

153. Un candidato a la alcaldia de la capital, realiza dos encuestas de tamano 120, a personas nacidas 
en la ciudad y 150 que viven permanentemente pero nacieron en otras ciudades, para determinar 
la proporcion de personas que estarian dispuestas a votar por el. Los resultados a favor fueron de 
40 y 55 respectivamente. 

a) Fijar limites de confianza del 99% para la diferencia entre estas proporciones. 

b) ^Se puede afirmar, al nivel del 1%, que hay una deficiencia significativa entre los porcentajes? 

154. Se quiere poner en marcha un plan de incentivos al personal de una empresa. Por lo tanto, se 
realizan dos muestras aleatorias, una de tamano 16 del personal de oficina y 22 del personal de 
operarios (planta). Recogida la informacion se encontro que el numero de personas a favor de la 
propuesta de la directiva fue de 10 y 12 respectivamente. a) Fije limites de confianza del 95% para 
la diferencia del porcentaje de estas opiniones; b) ^cree usted que los anteriores resultados permiten 
concluir que la aceptacion de la nueva politica de incentivos es igual para empleados y operarios? 
(Nivel del 5%). 

155. El 20 de agosto, una encuesta a 200 electores, en un barrio de la ciudad, indico que 120 estaban a 
favor del candidato X. Un mes despues, una encuesta a 300 electores indico solo 150 a favor del 
mismo candidato. 

a) Fije los limites de confianza del 95% 

b) Utilizando un nivel de significacion del 5%, ^indica la anterior informacion que la popularidad 
del candidato disminuyo entre las dos muestras? 

156. El director de una editorial de textos para secundaria, debe decidir sobre la publicacion de un 
texto, siempre que las preferencias entre los colegios privados y publicos sean iguales. Selecciona 
dos muestras de tamano 10 y 18 respectivamente, encontrando aceptacion de 6 y 10 colegios. De 
acuerdo a esos resultados fije limites de confianza del 90% para la diferencia. 

157. Una empresa comercializadora que ofrece dos sistemas de pago a sus clientes, desea saber 
la proporcion de cuentas por cobrar, con mas de 60 dias de vencidas. En el primer sistema la 
proporcion es del 18%, mientras que en el segundo, del 10%. Fije limites de confianza del 95% 
para la diferencia entre estas dos proporciones, cuyos tamanos muestrales fueron 16 y 20 clientes 
respectivamente. 

158. En una ciudad hay dos ligas de baloncesto, con rivalidad en cuanto a la calidad de sus jugadores y 
de encestadores. Un deportista propone seleccionar al azar 20 jugadores de cada liga, de tal manera 
que cada jugador lance una sola vez desde un determinado punto. Realizados los lanzamientos se 
encontro que 14 de la liga Ay 17 de la liga B encestaron. Fije limites de confianza del 95% para la 
diferencia entre las proporciones. 

Nota: De aqui en adelante se presentan ejercicios miscelaneos lo cual permite repasar lo aprendido, pues no se 
especifica a que distribucion corresponde. 
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159. Un proceso esta programado para empacar la cantidad media de una libra de cafe. Se toma una 
muestra aleatoria de 20 paquetes, resultando una media de 15,1 onzas y desviacion estandar de 6,3 
onzas. A1 nivel del 5% se podria afirmar que: a) ^se esta vendiendo un producto por debajo de su 
peso? b) ^si el valor verdadero es de 15,5 onzas, en la prueba anterior se cometio error?; c) ^de que 
tipo fue el error? 

160. Un inversionista desea decidir entre dos tipos de valores. Para ello cuenta con la siguiente informacion 
acerca del rendimiento expresado como porcentaje del precio. 


VALOR A: 

8,1 

8,5 

6,6 

8,6 

7,8 

7,6 

10,2 

9,2 

VALOR B: 

9,8 

9,3 

6,1 

10,7 

9,9 

8,2 




A1 nivel del 1%, ^sugieren estos datos que el valor B produce una utilidad mayor que el valor A? 


161. El gerente de una compania realiza dos muestras de tamano 120 empleados, cada una, con el fin de 
determinar el porcentaje de ausentismo. En la primera fabrica durante la semana de observacion no 
asistieron 12 personas, mientras que en la segunda fabrica no asistieron 16 empleados. i A1 nivel del 
2 %, se podra afirmar que la asistencia en la primera fabrica es superior a la segunda? 

162. Se requiere comparar el nivel salarial de los empleados de dos empresas. Se solicita informacion 
a la primera de ella y reporta que en una muestra aleatoria de 17 empleados, el ingreso promedio 
mensual es de $828 (miles de $), con una desviacion estandar de $63 (miles de $). 

Se elige en la segunda empresa una muestra aleatoria de 8 empleados con sueldos, en miles de pe¬ 
sos, asi: $738 $816 $763 $775 $820 $812 $910 $836. 

Fijar limites de confianza del 99% y probar con dicho resultado, si existe una diferencia salarial en 
las poblaciones de empleados de las dos empresas, al nivel del 1%. 

163. Un distribuidor de leche afirma que el contenido medio de grasa es de 3,07 mg./ cc. Se toma una 
muestra en 10 recipientes y se encuentran los siguientes resultados: 3,5 2,8 3,5 4,0 3,2 2,5 
2,8 3,0 2,5 y 2,6. ^A1 nivel del 1% se puede aceptar la afirmacion? 

164. Se hizo una entrevista a 7 subdirectores y a cinco analistas de mercado de una gran empresa. Se les 
pregunto, a traves de estas dos muestras aleatorias, cual consideraban que deberia ser el porcentaje 
optimo de cobertura de mercado para su compania. Los resultados fueron: 


SUBDIRECTORES: 

35,0 

31,3 

37,8 

30,3 

34,2 32,5 36,3 

ANALISTAS DE MERCADO: 

33,1 

28,6 

34,2 

33,5 

36,3 


a. Establezca limites de confianza del 95%, para la diferencia entre los promedios de porcentajes. 


b. Al nivel del 5% ^sugieren estos resultados que los subdirectores y analistas estan en desacuerdo 
cuando estiman la cobertura de mercado para la empresa? 
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165. Una empresa de manufactures, considera que controla el 10% del mercado de cigarrillos. Para 
comprobar lo anterior se toma una muestra de 2.500 fumadores y se les pregunta sobre la marca de 
cigarrillo que prefieren, con un resultado de 218 que prefieren esa marca. A1 nivel de 5%, ^se podra 
afirmar que ese porcentaje es correcto? 

166. Un fabricante garantiza que la resistencia promedio a la tension de los tornillos A, excede a los de 
B. Se toman dos muestras de 50 cada una, con los siguientes resultados: tomillo A con resistencia 
promedio a la tension de 95,7 kg. y desviacion estandar de 8,20 kg., mientras que los tornillos de la 
marca B, mostraron 87,8 kg. y 6,64 kg., respectivamente. A1 nivel del 1% comprobar la afirmacion 
del fabricante. 

167. Dos plantas utilizadas poruna fabrica se cree que presentan diferentes porcentajes de contaminacion, 
como consecuencia de ser alimentadas con combustibles diferentes. Durante un determinado 
periodo se toman 100 muestras de aire de la planta A con niveles del 32% de las veces, mientras que 
otra muestra de 80 refleja niveles del 24% de las veces. ^Se puede considerar que la segunda planta 
presenta menores niveles de contaminacion? Nivel de significance del 2%. 

168. La secretaria de salud quiere saber si esta en lo cierto, cuando afirma que la proporcion de fumadores 
en su localidad, para personas may ores de 16 anos, es del 40%. La secretaria lleva a cabo una 
muestra de 600 personas may ores de 16 anos, de las cuales 210 son fumadoras. Pruebe la hipotesis 
de que la proporcion de fumadores may ores de 16 anos es diferente del 40%, para cx= 0,05. 

169. El gerente de produccion, basado en su experiencia ha determinado que una operacion especifica 
requiere de un tiempo promedio de 12 minutos. El gerente sospecha que su personal requiere de 
un tiempo promedio diferente a los 12 minutos y por tal razon realiza una muestra en 8 de sus 
trabajadores con los siguientes resultados: 12,3 12,2 11,9 11,7 12,7 11,9 11,8 y 12,6. ^Es 
valida la sospecha que tiene el gerente? 

170. Un investigador de mercados utiliza dos medios para impulsar las ventas de su producto y desea 
saber si un medio es superior al otro en el aumento de las ventas. Discuta de manera completa 
como debe llevar el experimento, estableciendo las suposiciones necesarias que le permitan obtener 
conclusiones. 

171. Un economista que trabaja en el departamento de recursos humanos, desea determinar si la tasa de 
desempleo en dos grandes ciudades del pais, son diferentes. Con base en muestras aleatorias de 250 
personas en cada ciudad, encuentra 18 empleados en una y 13 en la otra. Con un nivel 5%, ^existe 
razon para afirmar que la tasa de desempleo en la segunda ciudad es mas baja que en la primera? 

172. Explique cada uno de los siguientes puntos: 

a) ^Cual es la finalidad de una prueba de hipotesis?. 

b) ^Cuando se debe utilizar la distribucion "t" de Student? 

c) ^Cuando se comete un error de tipo I? 

d) ^Como se define la inferencia estadistica? 
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173. El tiempo promedio para que una persona se intoxique, estando expuesto a una sustancia quimica, 
es de 24 minutos. En una muestra de 10 personas, se encuentra que el tiempo promedio es de 26 
minutos, con una desviacion estandar de 3 minutos. Pruebe la afirmacion contra la altemativa de 
que el tiempo medio es superior a los 24 minutos. ( oc = 0,01). 

174. Discuta los siguientes puntos: 

a. ^Que se debe entender por estimacion puntual? 

b. ^En que difiere la estimacion puntual de la estimacion por intervalo? 

c. ^Que se entiende por grados de libertad? 

d. ^Que es un intervalo de confianza? 

e. ^Que significan los terminos hipotesis nula e hipotesis altemativa? 

f. ^Por que es posible que la hipotesis nula sea rechazada cuando de hecho es cierta? 

g. ^Cuando se presenta una pmeba unilateral a la derecha? 

175. Las normas de una compania sobre el servicio a los clientes, especifican que no mas del 5% de los 
pedidos directos por correo no llegan al almacen, para ser cumplidos dentro de las 48 horas de su 
recibo. Se tomo una muestra de 191 pedidos, de los cuales 14 quedaban fuera del limite de las 48 
horas. /,Se justifica suponer que el requisito del 5% no se estaba cumpliendo? 


f APLICACION CON EXCEL 

LIMITES 0 INTERVAL OS DE CONFIANZA PARA LA MEDIA ARUM TICA 
MEDIANTE EXCEL 

M uestra grande n 30 

Formula: (I -X±Z —=L 

vn 

Para el calculo de estos limites, tomaremos como ejemplo la columna CALIFICACIONES obtenidas por 
los alumnos en las pmebas del ICFES que aparecen en la Tabla No. 1. De esta seleccion hemos tornado 
para el desarrollo de la aplicacion en Excel una muestra de 50 alumnos de una poblacion total de 1100 
alumnos. (Ver informacion en el SIL segunda parte). 

En la Tabla No. 1 la informacion se ubica en la columna H, para la seleccion se tiene en cuenta un 
rango entre H2 hasta H52, siendo H2, la celda correspondiente al nombre de la columna, que para este 
caso, corresponde a CALIFICACIONES; y el resto, es decir, el rango contemplado entre H3 hasta H52 
son los datos de la muestra. 

□ Seleccionamos en la ficha DATOS el icono ANALISIS DE DATOS. 

□ Aparece un cuadro de dialogo, correspondiente a ANALISIS DE DATOS, seleccionamos 
ESTADISTICA DESCRIPTIVA y hacemos CLIC en ACEPTAR. 
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□ En el cuadro de dialogo de la figura que sigue, digitamos los datos que nos solicitan: 


Figura No. 17. Estadistica Descriptiva. 
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□ RANGO DE ENTRADA en esta casilla tecleamos H1:H52 que corresponde al rango de la 
muestra seleccionada. 

□ Activamos haciendo CLIC en ROTULOS PRIMERAFILAy RESUMEN DE ESTADISTICAS. 

□ Finalmente establecemos el RANGO DE SALIDA en nuestro caso, ubicamos la celda en N3 y 
hacemos CLIC en ACEPTAR. 


Figura No. 18. Cuadro de Informacion Estadistica Descriptiva. 
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Figura No. 19. Cuadro de Resultados 
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□ Si reemplazamos los resultados en la siguiente expresion z tenemos: Con un nivel de 
confianza del 95%, z toma un valor de 1.96; y ^ corresponde al error tipico, y toma un valor 
de 6,48. Por tanto, el producto de 1.96 * 6.48, nos da como resultado, 12,70, tal como aparece 
en la siguiente figura, en la celda P3. 

□ Lo anterior implica que podemos cambiar el valor de Z, dependiendo de la confianza establecida. 
Algunos de los resultados que aparecen en el cuadro, seran utilizados para determinar los limites. 


Figura No.20. Calculo Limites de Confianza. 
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Lo anterior son los limites de confianza del 95% para Li 

Para muestras peque as < 30 


Formula: 


A = “± 




Dado que una muestra pequena corresponde a datos menores o iguales a 30, solo tomaremos los primeros 
veinte (20) datos de la Tabla No. 1 de la columna H, esto es, una muestra de tan solo veinte estudiantes. 
La caracteristica seguira siendo CALIFICACIONES y el rango que vamos a seleccionar corresponde a 
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H3:H22. Ademas la confianza y la hipotesis son las mismas que utilizamos para el ejemplo de muestras 
grandes. 

□ Hacemos CLIC en la ficha DATOS y seleccionamos la opcion ANALISIS DE DATOS. 

□ Hacemos CLIC en la opcion ESTADISTICA DESCRIPTIVA en el cuadro de dialogo que nos 
aparece. 



En el cuadro de dialogo que resulta del proceso anterior, tecleamos y seleccionamos las siguientes 
opciones: 

□ RANGO DE ENTRADA, en nuestro caso el rango debera ser seleccionado tecleando H2:H22. 

□ ROTULOS EN LA PRIMERA FILA, este icono debera ser seleccionado haciendo CLIC en el 
cuadro que le antecede. 

□ Lo mismo debera hacerse con el item RESUMEN DE ESTADISTICAS. 

□ De otra parte se procede a determinar el NIVEL DE CONFIANZA que en este caso como en los 
anteriores ejemplos es del 95%, por lo tanto, debemos teclear 95 en esta casilla. 

□ Nos falta establecer nuestro RANGO DE SALIDA, para ello seleccionamos la celda donde lo 
ubicaremos, en nuestro caso, senalamos la celda N3 y haciendo CLIC en ACEPTAR es posible 
observar los siguientes resultados: 


























































































400 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


Figura No. 22. Estadistica Descriptiva. 
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Figura No. 23. Cuadro de Resultados. 
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Reemplazando los resultados obtenidos en la formula siguiente podemos observar que: 



p= 308,5 ±2,093 


9.60 

V 20 


308,5 ±4,48 


.312.48 

\303,52 


Lo anterior nos indica que con un nivel de confianza del 95% los limites de confianza van desde 303.52 
hasta 312,48. 


Smtesis de capitulo 


Hoy en dia, se cuenta con cientos de procedimientos de pruebas estadisticas que pueden ser 
aplicadas a diferentes situaciones. Las mas importantes se describen ampliamente en los dife- 
rentes textos de estadistica, asi, quien este interesado no tendra dificultad de encontrarlos junto 
con la guia de como hacerla. En esta unidad solo se tomaron en cuenta cuatro tipos de pruebas, 
a saber: de una media aritmetica; de una proporcion; de la diferencia entre dos medias y la 
diferencia entre dos proporciones. 

Ademas del desarrollo de estas pruebas, aplicadas en muestras grandes {n > 30) y muestras 
pequenas ( n < 30) que comprenden la distribucion “t” de Student, se explicaron los procedi¬ 
mientos en la estimacion puntual y de intervalos. 

Se habla de estimacion puntual, para designar el simple numero que uno da a su mejor estima¬ 
cion correspondiente a una cantidad desconocida. Estimacion de intervalo son dos numeros en¬ 
tre los cuales se pretende que ha de estar la cantidad desconocida, con cierto grado de confianza 
o de seguridad. 

Tales intervalos suelen llamarse limites de confianza y fueron introducidos en EEUU por prime- 
ra vez por Jerzy Newman en 1937. 

La nocion de prueba estadistica , casi siempre, es nueva para el estudiante que se inicia en 
este campo del saber; generalmente, sin conocimiento, en muchas oportunidades las aplica. En 
general, se puede decir que el objeto de una prueba es proporcionar respuestas a diversos cues- 
tionamientos, a fin de obtener conclusiones. En este capitulo, se emplea la palabra prueba para 
designar el procedimiento que se utiliza para establecer situaciones de cierto o f also , es decir, 
siempre se van a tener dos posibilidades: que sea diferente {mayor o menor) o igual. 

Las hipotesis , para que sean de caracter estadistico, requieren hacer referencia a un valor es- 
tadistico, luego no todas las hipotesis son de caracter estadistico. Para ello es necesario la ex- 
perimentacion en el sentido de que la conclusion con respecto a la validez de tal hipotesis, se 
obtiene reuniendo datos a traves de muestras aleatorias, para luego ser examinadas, calculando 
el estimado correspondiente. 

Se puede decir que la prueba estadistica solo es, por tanto, el procedimiento experimental que se 
sigue cuando se quiere saber si es probable que una hipotesis estadistica sea cierta. 

Dentro de la realizacion de estas pruebas, es necesario identificar y saber definir terminos como: 
hipotesis nula\ hipotesis alternative pruebas unilaterales y bilaterales\ nivel de significancia; 
regiones criticas (de rechazo) y regiones de aceptacion. 










(AIM 


1M1L® 

Otras pruebas 
de hipotesis 

La inteligencia consiste no solo 
en el conocimiento sino tambien 
en la destreza de aplicar los 
Conocimientos en la practica. 

Aristoteles 


CONTENIDO 

Pruebas de hipotesis aplicadas a: 

■ Una varianza y Limites de confianza. 
Varianzas de dos poblaciones. 

■ Coeficientes de correlacion. 
Observaciones apareadas. Chi 
cuadrado. 

■ Prueba del signo. Correlacion de 
Spearman. Prueba de T de Wilcoxon. 

■ Prueba de U de Mann-Whitney y de 
Kruskal- Wallis. 

■ Sintesis de la Unidad. 

■ Ejercicios para Resolver, resueltos en 

el Sistema de Informacion en Linea 
SIL. 

COMPETENCIAS 


El estudiante debera estar en capacidad de: 

□ Distinguir en que casos en particular se 
debe aplicar cada una de las pruebas. 


□ Comprender la razon de su aplicacion y 
hacer correctamente su interpretacion. 

□ Entender con claridad los 
conceptos de poblaciones 
independientes y dependientes. 

□ Identificar las distribuciones 
parametricas y no parametricas. 

□ Manejar correctamente las tablas que 
se deban utilizar en cada prueba. 
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ALGUNOS ASPECTOS GENERALES 

En los capitulos que anteceden, los temas tratados correspondian a distribuciones muestrales , todas ellas 
seleccionadas al azar, provenientes de distribuciones parametricas y poblaciones independientes. 

En este capitulo, nos dedicaremos en gran parte a las Distribuciones no parametricas y algunas 
provenientes de poblaciones independientes de gran aplicacion en las ciencias sociales. 


PRUEBA DE HIPOTESIS DE UNA VARIANZA 


En gran parte, por no decir que en su totalidad, las unidades dedicadas a la Inferencia estadistica van 
encaminadas hacia el promedio; sin embargo, las inferencias realizadas con la varianza, pueden consti- 
tuirse en medidas mas importantes que el promedio, pues este ultimo, vale la pena recordar, es un punto 
de estimacion, siendo aquel valor que consideramos tipico, pero que no siempre lo va a ser, dado que 
depende del grado de variabilidad para ser representativo de un conjunto de observaciones. 


Primero, se hara referenda a la prueba de una sola varianza obtenida mediante una muestra aleato- 
ria, luego se realizaran con dos varianzas , supuestamente iguales en la poblacion, cuando corresponde a 
dos muestras aleatorias independientes provenientes de distribuciones normales. 

Partimos suponiendo que se tiene una poblacion normal con media JLl y varianza (7 generalmente 
desconocida. La simbologia que se utilizara en el proceso sera: 


Hipotesis nula: 

Hq'G 2 = (?l 

equivale a —> 

2 





La altemativa puede ser: H a \o 2 ^ a 2 H a :<j 2 > Cq H a : <j 2 < Cq que pueden ser presen- 
tadas tambien como: 


2 

2 

2 

H a :^* 1 

H a :Zj> 1 

H a : < 1 

^0 

Co 

Co 

Diferente 

Mayor 

Menor 


Para la realizacion de esta prueba se emplea la variante estadistica chi-cuadrado con fl -1 grados 
de libertad y esta dada de la siguiente manera: 


Recordemos que fl -1 lo simbolizamos por la letra V (nu) que significa grados de 
libertad. 


Veamos el proceso que se sigue en esta prueba de hipotesis y el uso de la tabla para calcular los 
valores criticos. 


X 


(n- 1) / 


► Establecer la hipotesis: 

/v4 = i 1 

Co Cq 

► Nivel de significacion: 

oc 
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► Establecer los supuestos: 


a. muestra aleatoria 

b. poblacion normal 


il-Z. 

_2 


V 


'0 


► Formular la variante estadistica: 

► Determinar los valores criticos 

► Calcular el valor estadistico, analizar y adoptar la decision. 


2 \ 

( 2\ 

X-\ 

2_| 

v L 

V 

J t ,v 

\ h 


Ejemplo 1. Docimar la hipotesis de que o = 8, dada S = 10 para una muestra de tamano 20. 
Solution: 


■> 


o 

2) oc=0,05 

3) a) La muestra es aleatoria 
b) La poblacion es normal 


a 64 



0,469 


2 2 

4) ^- = ^4 e )v=n -1 = 20-1 = 19 

2 

(Ver Tabla 9.1 pagina 409 de Percentiles de la distribucion 2L.) 

v 


( 2 \ 

z 

v 


= 0,469 


V /0,025 ; 19 


/ 2 A 

1 X_ 

V 


= 1,73 


V yu,975 ; 19 


5) 


X 


v 

V / 


=|j-=^=w« 
64 64 


0, 469 < 1,56 < 1,73, se situa en la zona de aceptacion; se puede 
afirmar al nivel del 5% que la varianza de la muestra, puede co- 
rresponder a una poblacion cuya varianza es 64. 


Limites de confianza 

Ejemplo 2. Para obtener los limites para S con una confianza del 95%, requiere del siguiente proceso: 
siendo: S = 10 £ 2 =100 V = 19 n = 20 


Solution: 

V 


= 0,469 


V 70,025 ; 19 


V 


= 1,73 


(Ver tabla 9.1 de percentiles) 


V 70,975 ; 19 


y 1 

0,469 < — <1,73 
v 


0,469 < — <1,73 
o 


> n r>: 


0,469 51 100 > 1,73 
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100 

0,469 


1,73 


10 

V0,469 


> G > 


10 

VU3 


10 10 
1,315 0,684 


7,60 < a < 14,62 


Ejemplo 3. En una ciudad se utilizan bombillas de la marca A durante anos, pero no se contempla cam- 
bio a la nueva marca B debido a su mejor precio. Los vendedores de la marca B, afirman que su producto 
es tan bueno como el de la marca A. A fin de docimar la afirmacion de los vendedores de la marca B, se 
probaron 81 de tales bombillas, que fueron adquiridas en los establecimientos del ramo, obteniendose 
una desviacion estandar de 80 horas en el tiempo de encendido, mientras que la larga experiencia con 
ampolletas de la marca A, ha mostrado una desviacion estandar de 90 horas. Si se admite que no existe 
experiencia entre las dos marcas, se trata de docimar la hipotesis de que la desviacion estandar de las 
bombillas marca B es igual al de la marca A. 



e) 


( z_ 2 ^ 

v 

v y 


<0,714. 


( 

v 
V 


>1,33 


f) 


‘ x 2 ^ 


v 

7 


. 80 
90 2 


= 0,79 


Aceptamos H 0 : -—^- = 1 , por lo tanto las desviaciones estandar, pueden considerarse iguales. 


Tabla 9.1 De percentiles de la distribucion 



Nota: las cifras en cuadros blancos corresponden a los dos ejercicios anteriores. 


Ejemplo 4. Docimar la hipotesis (7=8, dada S = 10 para una muestra de tamano n =20 
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Solution: 



d) 

e) 

f) 


/ 2\ 
1 X_ 

v 


= 0,469 


V 70,025 ; 19 


f 2\ 

x 

v 

v 

/ 2 \ 

Z 


V 

V 


<0,469 


= M = 1,5625 
64 


V 

v A975 ; 19 


= 1,73 


/ 2\ 

Z 

v 

V 


>1,13 


g) Se acepta la hipotesis H 0 : = 1 


EJERCICIOS PARA RESOLVER 


Ji 




La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema 
en Linea SIL. 



rmacion 


1. Determinar los limites de confianza del 95% para (7=8, y £=10 para una muestra de tamano: 

(a) 20 (b) 51. 

2. Efectuar el ejercicio anterior, considerando muestras de tamano: (a) 70 (b) 120. 

3. Dada X normalmente distribuida y los valores de la muestra n= 15 y S = 7, docimar la hipotesis 
de (7=5. 

4. Con los datos del ejercicio anterior, encontrar los limites de confianza de S. Utilizar: 

(a) el 95% (b) el 99%. 

5. Docimar la hipotesis (7 = 20, dada S = 10 para una muestra de tamano 25. 


6. Los siguientes datos representan las cantidades de un compuesto quimico determinado, obtenidos 
en analisis diarios. 

La experiencia de mucho tiempo, da el valor 0,5 para la desviacion estandar. 

(a) Docimar la hipotesis de que O = 0,5 para estos analisis. 

(b) Hallar los limites de confianza del 95%, para (7 de estos analisis. 


12,7 

12,3 

13,2 

12,8 

13,6 

13,1 

12,6 

12,4 

14,1 

13,3 

13,4 

13,1 

12,6 

12,9 

13,0 

12,4 

14,6 

13,8 

13,4 

12,7 

13,5 

12,5 


7. Para 100 empleados de una Cia. se observa el salario minimo mensual expresado en miles de pesos 
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(X), con el fin de determinar si la varianza anterior de todos los salarios fue de a 2 = 8; se obtuvieron 
los siguientes resultados de esa observation: 

Zx , 2 - 2.000 ^1 = 1.000 

n 

Suponiendo que se corre un riesgo de equivocarse del 5% ^que conclusion obtiene la Cia.? 

PROCEDIMIENTO MAS UTILIZADO EN LA PRUEBA CON UNA VARIANZA 

Anteriormente se realizaron pruebas de hipotesis sobre la varianza de una poblacion , usando para ello 
la tabla de Percentiles % 2 /u. Sin embargo, este procedimiento a pesar de lo facil en su aplicacion, es cos- 
tumbre generalizada utilizar en el proceso la tabla de Chi - cuadrado. 

Si consideramos, como ejemplo, la fabrication de algun instrumento de medicion, que requiera alta 
precision, el tecnico dedicado al control de calidad, ademas de interesarle la obtencion de un promedio o 
una proportion, le concede mayor importancia a calcular el grado de variabilidad , con el fin de mantener 
o reducir las diferencias que se puedan presentar. 

En la contestation de hipotesis, el procedimiento a seguir, es el mismo que se ha venido utilizando 
en este y en el anterior capitulo. Veamos como se procede con la varianza: 


Se formula la hipotesis: 

Hq :(J 2 — <Tq (hipotesis nula) 

* / T T 2 2 


ti a \G ^ <J 0 (hipotesis alternativa) 

Grado de significacion: 

2) °c = 0,05 


2 (n-\)S 2 

Variante estadistica: 

3)1 = 2 

°0 


Asi como se realiza una prueba bilateral, tambien pueden efectuarse pruebas unilaterales (a la dere- 
cha o izquierda), teniendo en cuenta las necesidades o el enunciado del ejercicio. 


Unilateral a la derecha 

Unilateral a la izquierda 

H 0 :a 2 =c t 2 0 

°b° 

ll 

CN 

b 

H a :e 2 >o i 

H a :a 2 «rl 


Ahora procedemos a su aplicacion, mediante ejercicios practicos. 

Ejemplo 1. Un buen profesor, confecciona un tema de examen que permita determinar si se logro un buen 
aprendizaje, a traves de un nuevo metodo de ensenanza establecido gracias a su experiencia. Considera 
que los resultados deben presentar muy poca variabilidad, establece una O = 0, 65. Realiza una prueba 
en 25 de sus estudiantes, con los siguientes resultados: x =3,6 y S = 0,80. Determinar, al nivel del 5%, 
que la dispersion obtenida en la muestra, es igual a la establecida. 


Solucion: 
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13,848 36,415 


2 2 

En la tabla de observamos que para i; = n- l = 25-l=24,el valor de Zo ,95 =13,848 y Zo,os. = 
36,415 (Ver tabla IV - Chi-cuadrado). Como X 2 (calculado) es de 36,36, cae en la zona de aceptacion, es 
decir, entre los limites 13, 848 y 36, 415, permitiendo concluir que el examen cumple con la condiciones 
fijadas por el profesor al nivel del 5%. 

Ejemplo 2. Supongamos que se aplica la prueba, con la expectativa de que el resultado de la varianza 
obtenida en la muestra de 25 estudiantes, sea superior al esperado por el profesor al nivel del 5%. 


Solution: 


(7 = 0,65 <J= 0,4225 <? = 0,8 

1) H 0 =a 2 = 0,4225 
H a : a 2 > 0,4225 

2) oc = 0,05 

2 ( n-\)S 2 (25-1)0,64 


3) r=- 


v=n- 1 = 

a = 


1 = 24] 2 

= 0,05j^°’° 5- ’’ 


0,4225 
= 36,42 


= 36,36 


S — 0,64 oc = 0,05 





Se concluye, que el grado de variabilidad obtenida en la muestra, al nivel del 5%, no es superior al 
senalado por el profesor. Sin embargo, algunos autores cuando realizan una prueba unilateral, toman el 
doble para la region critica, tal como lo haciamos con la "t" de Student , de acuerdo a este procedimiento, 
el Chi de tabla seria 2o,io = 33,20 , por lo tanto concluiriamos, que los resultados obtenidos son supe- 
riores al esperado por el profesor, al nivel del 5%. 


Limites de confianza 


Recordemos que el fijar limites, siempre debe considerarse como bilateral, ademas, se trabaja con la va¬ 
rianza muestral. Es recomendable, antes de aceptar o rechazar la hipotesis nula, fijar limites de confianza 
que sirvan para establecer dentro de que valores debe estar la varianza poblacional, con cierto grado de 
confiabilidad. La formula empleada es: 


0 n-l)s z 

Z* 


< cC 


(n- 1) s z 

Zf 


zf = Valor inferior 
zl = Valor superior 
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Ejemplo 3. Sean los valores: 

S = 0,8 S 2 = 0,64 n = 25 P = 95% 


Solution: 


(»- 1 ) 5 2 

z' 


< a 


(«- 1 ) 5 2 

xf 


(25-1)0,64 _ 2 (25-1) 0,64 15,36 „ 2 „ 15,36 

36,415 < ° < 13,848 36,415 ° 13,848 

Por lo tanto los limites para la varianzapoblacional son: 0,42 <G 2 < 1,11. La varianzapoblacional, 
estara entre 0,42 y 1,11, con una confianza del 95%. 

EJERCICIOS PARA RESOLVER 


La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

8. Todos los ejercicios dados para resolver en el tema anterior sobre varianza, aplicando la tabla de 
percentiles de X 2 /v, pueden ser utilizados para trabajar con la tabla de Chi- cuadrado ( X 2 ). Se le 
deja al lector su aplicacion. 

9. Un fabricante de un determinado producto, establece una duracion promedio de trabajo continuo de 
5.000 horas y que O < 400 horas. Se examino un muestra de 40 de este producto y se encontro que 
su media es de 5.500 y varianza de 172.000 horas 2 . Al nivel del 1% ^estos datos proporcionan una 
evidencia que O sea mayor a 400? 

10. Un vendedor experto que trabaja en un almacen, asegura que el tiempo dedicado a la atencion de 
un cliente en promedio es de 25 minutos, con una desviacion tipica ( O ) de 8 minutos. Se pregunta, 
si el grado de variacion en la atencion al cliente es diferente. Una muestra a 20 clientes da una 
desviacion tipica de 10 minutos. Pruebe la hipotesis al nivel del 10%. 

11. En una muestra de Tl = 25, se obtiene una S 2 = 67,8. Al nivel del 5% 

a) ^Indica este resultado que S 2 es superior a 65? 

b) Fije los limites de confianza del 95% para la varianza poblacional. 

12. Una muestra de n = 28, produce una desviacion tipica de 168,5. Al nivel del 10% 

a) ^Se puede deducir que O 2 = 171? 

b) Fije los limites de confianza del 90% para la varianza poblacional. 



COMPARACION ENTRE VARIANZAS DE DOS POBLACIONES 

DISTRIBUCION F 

Cuando se realizo la aplicacion de la “t” de Student, en (muestras pequenas), pruebas de hipotesis para 
diferencias entre medias muestrales, las estableciamos con base en dos supuestos: 

a) El primero, el mas utilizado, que las muestras provienen de dos poblaciones con varianzas 
identicas , aceptando a degas que fuera cierto. 
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b) El otro, bajo el supuesto, que las varianzas poblacionales fueran diferentes. Ahora, se trata 
de probar mediante la aplicacion de la Distribution F , la validez de que las varianzas 
poblacionales, sean identicas o diferentes. 


Es de anotar que la Distribution F, desarrollada por Sir Ronald Fisher, es una medida muy diferente 
a las otras hasta aqui desarrolladas, no es simetrica y su forma depende del numero de grados de libertad 
asociadas con s* y S%- 

Siguiendo procedimientos conocidos, primero se plantean las hipotesis H o y H^; luego el nivel de 
significacion; se determina el valor F en la variante estadistica y finalmente se toma la decision de aceptar 
o rechazar que las varianzas poblacionales sean identicas. 


1 ) 


T T . _2 _ —.2 

H, • C>\ — O 2 


2) oc = 0,05 



Varianza mayor 
Varianza menor 


Consulta de la tabla F 

A1 final del libro aparece la Tabla XVI cuyo proceso de utilizacion es el siguiente: en la parte superior 
(nominador) correspondiente a la formula de F, aparece la varianza de mayor valor y en su parte inferior 
(denominador) la de menor valor. Establecido el orden de las varianzas, determinamos los respectivos 
grados de libertad (v=n~\ y v 2 = n — 1); el primero, se leera en la primera linea o renglon de la tabla 
y el segundo v 2 en la primera columna. Una vez localizados los dos valores, buscamos su punto de 
intersection siendo este el valor correspondiente a F. 

Ejemplo 1 . Focalizar los valores de F, utilizando la tabla respectiva, dependiendo del nivel de signifi¬ 
cacion. 


v 1 = 12 

v , = 15 

v, =40 

v x =24 

a) v 2 =16 

o 

<N 

II 

S' 

O 

II 

(X) 

o 

d) ^2=17 

oc = 0,05 

8 

ii 

o 

o 

8 

ii 

o 

o 

oc = 0,025 

Solution: 

a) F = 2,42 

b) F = 3,09 

c) F = 1,40 

d) F = 2,56 


Para los Umites de confianza , tendra que ser bilateral, por lo tanto el proceso para determinar los 
puntos criticos, sera: 


a) v x =15 

b) = 30 

O 

P 

II 

00 

o 

<N 

II 

<N 

v 2 - 40 

v 2 =15 

oc = 0,05 

oc =0,01 

oc = 0,025 

^=2,20 

F v v =2,20 

F V] , Vl =3,20 

^ 2 ,,,= 2 ’ 33 

F v =2,30 

^=4,10 

F s = 2,20 

F = 2,20 

F s =3,20 

F — 1 — 0,429 
' 2,33 

F = l=o, 435 
' 2,30 

^=4,io= 0 ’ 24 
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Los anteriores calculos se hicieron con fines de explicacion, dado que los valores criticos a la 
izquierda de F, no aparecen en las Tablas (F = punto critico superior; F. = punto critico inferior); por 
lo tanto el limite inferior se obtiene calculando el recfproco, al mismo tiempo que se intercambian los 
grados de libertad, v x como v 2 y v 2 como si fuese v v 

Conociendo el manejo de la Tabla F, veamos como se procede en la realizacion de las pruebas de 
hipotesis, con el fin de establecer si hay o no igual variabilidad en las dos poblaciones, de donde se ex- 
trajeron las muestras. 

Ejemplo 2. Supongamos la selection de dos muestras, de tamanos n l = 21 y n 2 = 16, cuyas varianzas 
muestrales son 5^=57,12 y =25,68 respectivamente. i Dan estos resultados suficiente evidencia, 
que nos haga pensar que las varianzas poblacionales sean distintas? Nivel del 5%. 


Solution: 


Uj =21 — 1 = 20 sf =57,12 
v 2 =16-1 = 15 s]= 25,68 


1) H q : o' 2 = cj 2 

2) oc = 0,05 

3) F= S 1=51AA 

sl 25,68 


= 2,22 


= 2,57 


= 2,20 



Estos resultados no muestran evidencia, al nivel del 5%, que las varianzas poblacionales sean dis¬ 
tintas. 

Nota: No hay necesidad de localizar 
el punto critico inferior: 

(1/2,20 = 0,45), dado que F 
calculado siempre va a ser 
positivo, (F > 1), pues en el 
numerador se coloca el mayor 
valor de S 2 . 

Sin embargo, numerosos autores, cuando la prueba es bilateral , toman el total del nivel de signi¬ 
fication para cada zona critica, dandole el mismo tratamiento que se dio en la distribucion “t” de Stu¬ 
dent, por lo tanto el valor para el punto critico sera F y ^ = 2,33 . De acuerdo con este procedimiento F 
= 2,22, cae en la zona de aceptacion, es decir, aceptamos H Q , luego podemos concluir que las varianzas 
poblacionales son identicas, al nivel del 5%. 

Ejemplo 3. Se realizan dos procesos diferentes en la fabricacion de un determinado producto. Durante 
un periodo de observacion de 31 dias, se determino el numero de unidades producidas con sus respecti- 
vas varianzas, estos resultados en su orden fueron de: 290 y 296 unidades, con varianzas de 1.102,24 y 
528,70 respectivamente ^Presentan estos resultados suficiente evidencia para concluir, al nivel del 5%, 
que la variabilidad en la produccion diaria, es superior en uno de los procesos? 
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Solution: 

= 31 Vi =30 Si =1.102,24 

n 2 =31 v 2 =30 / « 1> « J =1 > 84 5 2= 528,70 



A1 nivel del 5%, hay base suficiente para concluir que una de las varianzas es significativamente 
superior a la otra. 


Como se vio en el caso bilateral, tambien 
hay divergencias entre los autores en la de- 
terminacion del valor correspondiente a la 
region critica. En este ejercicio se siguio el 
procedimiento aplicado en la normal (tra- 
bajando en Z), sin embargo otros toman el 
doble del nivel de significacion, es decir, 
en este caso seria del 10%, tal como se trabaj 
critico seria F Vl ,v 2 = 1,61 en vez de 1, 84. 



con la “t” de Student, asi, que el valor del punto 


Limites de confianza 


Tambien con la distribution F , se pueden establecer limites de confianza para el cuociente de las varian¬ 
zas, aplicando la siguiente formula: 


s 

s 


2 

]_ 

2 

2 



Ejemplo 4. Durante una jornada en la bolsa, se tomaron dos grupos de industrias, con 30 y 41 empresas 
cada una, registrandose los precios de cierre en sus acciones, siendo sus medias de $403,3 y $425,4 y 
varianzas de 15,4 y 29,6 respectivamente. Encuentre un intervalo de confianza del 95% para el cuociente 
de las varianzas. 


Si = 29,6 

v x =30 

F 

1h,V 2 

s 2 =15,4 

v 2 =40 

F 

29,6 

15,4 

1 

1,94 

< < 29 ’ 6 
<r 2 2 15,4 

(2,01) 

i ?2 A 

1,94 a\ 

< 1,92 (2,01) 

-> 


= 1,94 
2,01 


oc 


0,05 


: 0,025 


0,99 < At < 3,86 


El intervalo para el cuociente poblacional, estara entre 0,99 y 3,86 con el 95% de confianza. Aqui 
tambien hacemos la misma observacion establecida para la prueba bilateral y la unilateral, sobre la forma 
como se determina el valor de la region critica. Observemos que a= 0,05 se distribuye la mitad para cada 
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lado, por lo tanto utilizamos la tabla de F para determinar el valor correspondiente a a = 0,0250, de ahl 
en adelante el proceso es igual al que se hizo para la normal (muestras grandes), sin embargo algunos 
proceden, al igual que en el caso de las muestras pequenas, asi, cuando a = 0,05: 


29,6 

15,4 


1 

1,74 



(1,79) 


=1 > 74 

=U9 


1,92 

1,74 


< 1,92 (1,79) 


1,92 

1,74 


< < 1,92 (1,79) 


Nota : Se exponen estos procedimientos que pueden confundir (en algunos casos), 
para que el lector este prevenido y conozca, que existen criterios diferentes en su 
aplicacion. De acuerdo con la orientacion dada por el profesor y a su criterio, podra 
identificarse con alguno de ellos. 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

13. Una serviteca desea corresponder a sus clientes por su confianza, en especial con los neumaticos 
para camiones que mas acreditan el negocio. Ofrece dos marcas que tienen la misma duracion, pero 
no esta muy seguro de su variabilidad. Selecciona muestras de tamano 16 y 21 neumaticos de cada 
marca, con varianzas de 36.000 y 42.000 km 2 . 

a) ^Hay evidencia de una diferencia entre las varianzas poblacionales? 

b) Fije los limites de confianza del 95%. 

14. Se comparan dos metodos para realizar cierta operacion. Supongamos que los resultados obtenidos 

en las dos muestras fueron: x = 725; = 61 y y = 661; s 2 y = 86 ; y los tamanos muestrales son: 

7 y 13 respectivamente. Docime o pruebe la hipotesis de que la segunda muestra (y), presenta 
mayor variabilidad que X. 

15. Dos muestras sobre rendimiento academico, una aplicada a los estudiantes del diurno, con notas de 
3,8 4,1 3,7 4,3 3,2 3,8 4,3 y otra al nocturno con calificaciones de: 3,3 3,8 3,4 4,9 4,8 
3,1 4,7 4,9. Pruebe la hipotesis al 2%, que no hay diferencia en cuanto al grado de variabilidad. 

PRUEBA DEL COEFICIENTE DE CORRELACION DE PEARSON r = R 



Cuando en un problema de analisis de regresion, como se vera en los capitulos 11 y 12, se calcula el 
Coeficiente de correlation , es importante saber si ese resultado pudo haberse dado al azar, con una buena 
probabilidad en una muestra de tamano considerado. 


Para efectuar la prueba de hipotesis en la correlacion, cuando la muestra es pequena, se emplea la 
distribucion “t”, y “Z” para Tl >30 obteniendose mediante la aplicacion de la siguiente formula: 



Siendo V el coeficiente de correlacion y Ifl el numero de pares observados. 


Tambien se puede escribir la formula de “t” y la del coeficiente de correlacion de la siguiente manera: 
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Jl l Z.xf-(2.x i ) 2 ]l l I.yf-(I.y i ) 2 ] 

El valor de V se obtiene generalmente mediante la aplicacion de esta formula y otras mas, con las 
cuales se llega al mismo resultado, como ya se dijo, podra observarse en los capitulos 11 y 12 en los 
temas “Regresiony Correlation”y “Series Cronologicas”. 

La anterior formula se aplica, cuando la Hipotesis nula (H ) se formula en el sentido de que no 
existe correlacion entre las dos variables, es decir, que la correlacion es igual a 0, frente a la hipotesis 
alternativa de que sea diferente (docima bilateral ); que sea mayor de 0 (docima unilateral a la derecha) 
o menor de cero (docima unilateral a la izquierda). 

Ejemplo 1. En una muestra de 28 pares de observaciones de X y y, se obtuvo un Coeficiente de correla¬ 
cion de 0,42, ^indica esto a un nivel de significacion que existe una correlacion significativa? 


Solution: 


1) Hq R — 0 (No hay correlacion) 
H a :R>0 (Si hay correlacion) 


Tambien: H 0 : p = 0 

H : p > 0 
i_ L L _i 



Rechazamos la hipotesis nula H 0 y aceptamos la hipotesis alternativa H a : R > 0, es decir, que al 
nivel de 5% se puede aceptar una correlacion mayor de 0, que puede ser significativa. 


Cuando en la hipotesis nula se plantea que R ^ 0, solo puede utilizarse para decidir si en una deter- 
minada muestra el coeficiente de correlacion es significativamente diferente a 0 (docima bilateral ), aun- 
que se puede efectuar la prueba unilateral de que sea mayor de 0, cuando R tiene signo positivo o menor 
de 0 cuando el signo es negativo. No hay procedimiento alguno para establecer limites de confianza de R 
o de p(rho). 


Para muestras grandes (n= 31 o mas) se utiliza Z, siendo la formula mas utilizada 


Z =- 


y/n-1 


; tam¬ 


bien se aplica otra formula diferente a la anterior y se trabaja con Z, de la siguiente manera: 


Z = 


Z - p 2 


1 1 (1+r 

Siendo: M : = ~ l°g„ -- 

2 l 1 -r 


= - (2,3026) log 


/l + r \ 


\ l ~ r j 


que tambien se puede presentar asi: 


[1 + r i 

p z = 1,1513 log P ara hallar el valor de Z, se puede aplicar la formula anterior. Ambos valo- 

res se pueden obtener directamente sin necesidad de calculo, consultando la tabla 9.2 de transformacion 
de r a Z, o la tabla V al final del libro. 
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La desviacion estandar se simbolizara por G y se calcula asi: 

Ejemplo 2. En una muestra de 40 pares de observaciones, el Coeficiente de correlacion obtenido es 
0,86. Use el nivel de significacion del 5% para probar la hipotesis de que el coeficiente de correlacion 
poblacional es 0,90. 



Solution: 

ju z = U513 log 

1 1 


1 + 0,90 t 
1-0,90 J ’ 


= 1,472 


V37 6,08 


= 0,1644 


1) H 0 : R = 0,90 H o : P = 0,90 
H a : R ± 0,90 H x :p * 0,90 


4) Z = 


Z = 


Z-jU z 

<y 2 

1,293 -1,472 
0,1644 


= -1,09 


Z = 1,1513 log 


2) oc= 0,05 


1 + 0,86 1 _ 
1 - 0,86 ) ’ 


3) o z = 0,1644 



Z = -1,09 cae en la zona de aceptacion: se acepta la hipotesis nula, es decir que el coeficiente de 
correlacion 0,86 en una muestra, puede pertenecer a una poblacion cuyo coeficiente de correlacion es de 
0,90, con un nivel del 5%. 


Agreguemos que el Coeficiente de correlation es una medida establecida por Karl Pearson, 
que proporciona la fuerza de asociacion entre una variable independiente y otra dependiente. 

Transformacion de r a z I es decir , z = 0,5 Log e j 
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Ejemplo 3. En una muestra de 42 pares de valores de X y y se obtuvo un coeficiente de correlacion 
de 0,22, i Indica esto una correlacion significativa con base en un nivel de significacion del 5%? 
Solution: 

i r — — — ^ 

1) Hq \ R = 0 (No existe correlacion ) | ^0 • P ~ ^ | 

H a ! R ^ 0 (El coeficiente de correlacion es significativo) ]_^ a - P ^ ® 


2 ) 

3 ) 

4) 



1,43 < 2,021 por lo tanto aceptamos la hipotesis nula, es decir, que el Coeficiente de correlacion 
0,22 no es significativo, al nivel del 5%. 


Ejemplo 4. Al efectuar un estudio sobre la marca de cierto producto, se encontro que 50 personas habian 
usado y cambiado anteriormente dicha marca. 

La relation entre el tiempo en que habian usado la marca, antes de sustituirla por otra y el numero de 
ex-usuarios en cada caso, fue la siguiente: 


ANOS DE USO: 

(x) = 

0,5 1,0 1,5 

2,0 

2,5 

3,0 

3,5 

4,0 

4,5 

5,0 

No. EX-USUARIOS: 

0) = 

8 6 9 

4 

6 

5 

3 

2 

4 

3 


Sabiendo que el coeficiente de correlacion de este ejercicio es -0,8 (r = -0,8), docime al nivel del 
5% que el coeficiente es significativo. 

Solution: 


1) Hq ! R — 0 (No existe correlacion entre el tiempo de mo y numero de muarios) 


H a : R < 0 ( Existe correlacion negativa. entre las variables y es significativa) 


2 ) 

3) 

4) 



-3,77 < -1,86. Se rechaza la hipotesis nula. Aceptamos la hipotesis alternativa de que existe corre¬ 
lacion negativa entre las variables. 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 

en Linea SIL. 

16. Un coeficiente basado en una nuestra de tamano 20 resulto ser 0,37. ^Se puede deducir al nivel 
de significacion del 5%, que el Coeficiente de correlacion de la poblacion correspondiente difiere 
de 0? 

17. En un estudio de correlacion entre el numero de accidentes infantiles en relacion con las zonas 
verdes, se obtuvo un Coeficiente de correlacion de -0,92 (r = -0,92), sobre la base de 18 barrios 
de Cali. Mediante una docima bilateral y un nivel de significacion del 5%, ^que se puede concluir 
respecto al Coeficiente de correlacion? 

18. Se eligen aleatoriamente once estudiantes entre los que han terminado el curso de matematicas II y 
estadistica II. Sus calificaciones finales (de 0 a 100) son: 


MATEMATICAS II: (JC) 67 81 65 42 53 40 71 64 60 68 49 

ESTADISTICA II: (y) 92 65 81 75 85 78 77 79 81 82 85 


Suponiendo que los pares de calificaciones se extraen aleatoriamente de una poblacion normal 
bidimensional, docime la hipotesis de que la calificacion de matematica II de un estudiante, es in- 
dependiente de su calificacion en estadistica II (oc = 0,05 ). 

19. Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de salsa picante 
envasada, que puede preparar en una forma mas espesa (X) o en otra forma menos espesa (Y). Para 
medir la preferencia por uno y otro tipo de salsa, utiliza una muestra de 10 amas de casa, quienes 
manifiestan sus preferencias por dichos tipos de salsa, con los siguientes resultados: 



Aplique el test de correlacion al nivel del 5% 

20. En una muestra de 35 pares, el Coeficiente de correlacion obtenido es 0,80. Use el nivel de 
significacion del 5%, para docimar la hipotesis de que T = 0,90. 

21. Un Coeficiente de correlacion en una nuestra de tamano 24, resulto ser V = 0 ,75. /,Puede rechazarse 
la hipotesis de que el coeficiente de correlacion poblacional sea igual a 0,60? 

22. En una muestra de 52 pares, el Coeficiente de correlacion obtenido es 0,53. Se piden los limites de 
confianza del 95% para el Coeficiente de correlacion. 

23. Docimar al nivel del 5%, la hipotesis de que R = 0,60 (p = 0,60 ). Si en una muestra de 103 pares 
se ha obtenido un Coeficiente de correlacion igual a 0,90. 

24. Se toma una muestra de tamano 52 en una poblacion cuyo Coeficiente de correlacion es 0,59. 
Encontrar la probabilidad de que el coeficiente de correlacion de la muestra sea 0,40 o menos. 
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25. En una poblacion con Coeficiente de correlacion 0,65, se toman muchas muestras de igual tamano. 

Si el 15% de estas muestras tienen un coeficiente de correlacion de 0,75 o mas, i cual es el tamano 
de la muestra? 

26. Dos Coeficientes de correlacion obtenidos de tamano n l = 28; n 2 = 35 resultaron ser: r 1 = 0,5 y 
r 2 = 0,30 respectivamente. ^Hay una diferencia significativa entre los dos coeficientes al nivel de 
0,05? 

27. El servicio de control de calidad somete dos muestras de mercancia a una prueba, para determinar 
si existe una relacion entre la resistencia y la duracion de utilizacion del producto. La primera 
muestra esta formada de 15 unidades y la segunda de 27. Se encuentra un coeficiente de correlacion 
de r 1 = 0,80 y r 2 = 0,60. ^Podemos afirmar al nivel de significacion del 5% que si existe una 
diferencia significativa? 

28. Supongamos dos variables X y Y. Probar la hipotesis al nivel del 5% de que el Coeficiente de 
regresion (Coeficiente angular) de la ecuacion de regresion sea tan bajo como 0,70. 


x v 

5 

8 

10 

12 

20 

y{- 

3 

2 

5 

6 

14 


Nota: este ejercicio es de Prueba de Regresion y no de Correlacion (capitulo 12) 

PRUEBAS CON OBSERVACIONES APAREADAS 


Anteriormente, se realizaron pruebas de diferencias entre dos medias muestrales, es decir, se trabajo con 
muestras provenientes de dos poblaciones independientes , como por ejemplo, cuando se desea probar la 
efectividad de un fertilizante; el procedimiento que se siguio consistio en tomar una poblacion de lotes 
o de hectareas, a las cuales se les ha aplicado un fertilizante, se extraia de ella una muestra de lotes a 
fin de obtener el promedio de rendimiento por lote o por hectarea. Este resultado es comparado con otro 
obtenido de una muestra de lotes, provenientes de una poblacion, que no han sido fertilizados. De esta 
manera se puede probar si con el uso del fertilizante se logra obtener un mayor rendimiento por lote. 

El anterior procedimiento conlleva, en algunos casos, a cometer errores en el analisis de los resul- 
tados, pues en el ejemplo senalado, puede ser que las variaciones en el rendimiento no sean consecuen- 
cias del uso del fertilizante, sino de otros factores ajenos a el, como: condiciones del clima, calidad del 
terreno, etc. Esto nos obliga a realizar un procedimiento diferente que elimine estos factores ajenos, 
utilizando para ello las diferencias entre los pares de observaciones, provenientes de poblaciones rela- 
cionadas, denominados tambien poblaciones dependientes . Veamos el proceso a seguir en este ultimo 
caso: se toma una muestra de lotes, y en cada uno de ellos se procede a fertilizar la mitad, comparando su 
rendimiento con la otra mitad que quedo sin fertilizar; de esta manera eliminamos factores que puedan 
afectar los resultados, ya que las condiciones seran iguales, tanto para el area fertilizada como para la no 
fertilizada. 

Podrfamos dar otro ejemplo, para entender un poco mas el nuevo procedimiento que se puede 
utilizar, dependiendo de la poblacion que se examina. Supongamos que un empresario desea aumentar 
el rendimiento de su personal, para lo cual disena cursos de capacitacion para mejorar las condiciones 
del trabajador. La prueba consiste en determinar si esos cursos son efectivos, para ello selecciona una 







420 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


muestra de trabajadores que no han asistido al curso, luego determina el promedio de rendimiento para 
el grupo o muestra, ya sea respecto al tiempo de duracion en su ejecucion o en cuanto a la cantidad de uni- 
dades o tareas realizadas en un determinado periodo. Este resultado, se compara con otro obtenido en una 
muestra proveniente de una poblacion de trabaj adores que han asistido a entrenamiento o capacitacion. El 
anterior procedimiento puede distorsionar los resultados, pues dejamos aparte aspectos o condiciones que 
presenta cada persona, por ejemplo sentirse bien en el trabajo, tener habilidad innata para desarrollarlo, 
responsabilidad, condiciones emocionales, etc. Para ello se puede preferir otro procedimiento, que consiste 
en medir el rendimiento, en cada uno de los trabaj adores que no han sido sometidos al curso y que forman 
parte de la muestra; luego a cada trabaj ador seleccionado se le compara su rendimiento antes y despues del 
entrenamiento, lo cual nos permite eliminar factores que pueden conducir a resultados erroneos. 


Anteriormente se comparaban dos muestras elegidas aleatoriamente, es decir, las dos 
poblaciones de donde se extraian las muestras se consideraban independientes. En cambio en 
las observaciones apareadas , se debe tomar una muestra aleatoria de pares, de manera que 
cada observacion este asociada con alguna observacion en particular. La muestra de pares de 
observaciones da base para considerar la existencia de dos muestras dependientes , donde las 
observaciones de un par estaran relacionadas entre si. 


La mayorfa de autores consideran de gran importancia su aplicacion, tanto en problemas que com- 
prenden datos antes y despues, como en aquellos casos donde se desea comprobar si se producen cam- 
bios de actitud. 


Consideremos en primer lugar la simbologia que se utilizara: d. = diferencia para cada par de ob¬ 
servaciones, (d. = x - y). 


d = Media aritmetica de las diferencias 


d = 


Yd, 


n = Tamano de la muestra. Sera igual al numero total de pares que conforman la muestra. 


N = Numero de pares de observacion en la poblacion. 



Ejemplo 1. En una escuela publica se seleccionaron 10 pares de ninos de primer ano para comparar 
similitud de inteligencia y preparation. Un nino de cada par fue ensenado a leer con un metodo y el otro 
nino con otro metodo. Despues del periodo de aprendizaje, los ninos fueron sometidos a una prueba de 
lectura con los siguientes resultados, (el puntaje utilizado fue de 0 a 100): 
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NINO N° : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

METODO I 

(x) 

65 

68 

70 

63 

64 

62 

74 

72 

70 

66 

METODO II 

( y. ) 

63 

68 

68 

60 

68 

66 

70 

78 

70 

70 


un nivel de signification del 5%, existe alguna diferencia significativa en la mayor efectividad de 
alguno de los metodos aplicados? 

Solution: 



n 


-7 

10 


-0,7 


1 ) 

3) 

4) 



t = - 0,63 se ubica en la zona de aceptacion, por lo tanto aceptamos la hipotesis nula (a d = 0) Se 
puede concluir que ninguno de los metodos es superior al otro, al nivel del 5%. 

Ejemplo 2. Supongamos que se quiere estudiar la efectividad de una dieta y se nos proporciona la si- 
guiente informacion referente a los pesos, antes y despues en una muestra al azar de 8 mujeres adultas 
con edades de 35 a 40 anos o mas (datos en libras): 


MUJERES N° : 

1 

2 

3 

4 

5 

6 

7 

8 

ANTES :(x) 

137 

130 

124 

138 

149 

140 

168 

152 

DESPUES : (y) 

132 

121 

126 

130 

147 

141 

159 

147 


Docimar al nivel del 5% que la dieta fue efectiva. 
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Solution: 



Nota: Se hubiera podido trabajar con diferencias positivas y la grafica seria al contrario, lado 
derecho. El resultado es el mismo. 



n 


-^■=-4,375 



4,34 4,34 
V8 2,83 ^ 


S 


d ~ 


£(W,-J ) 2 
n -1 


131,87 

7 


4,34 


H 0 \ a =0 (la dieta no es efectiva) 
H a : a d < 0 (la dieta es efectiva) 

2) oc = 0,05 3) S-j =1,53 



-4,375 

1,53 


- 2,86 


v = 8-1=7 -> f =-1,895 


oc=0,l( 



-1,895 


t = - 2,86 se ubica en la zona critica y se rechaza la hipotesis nula, por lo tanto aceptamos que la 
dieta ha sido efectiva, al nivel del 5%. 


Nota : Se habia dicho que d. = x. - y. pero en este caso cuando la efectividad de una dieta 
corresponde a una disminucion del peso, si se quiere se puede cambiar el signo para cada 
diferencia; el resultado debe ser el mismo, la prueba se hace al lado contrario. 


En el calculo de los limites de confianza, se aplicara la siguiente formula: 



Ejemplo 3. En un experimento referente a variedades de maiz sobre 16 pares de lotes, la diferencia entre 
las medias de los rendimientos de las variedades fue de 3 arrobas por hectarea. El error estandar de esta 
diferencia fue de 1,1 arrobas por hectarea. 

a) Determinar los limites de confianza del 95% para la diferencia media de rendimiento entre las 
dos variedades. 
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b) Use la respuesta del punto a) para decidir si existe una diferencia significativa entre los 
rendimientos de las dos variedades ( oc = 0,05 ). 


Solution: 


1) d= 3 7 =1,1 n = 16 v = 15 t = 2,131 


a 3. =d±tS d 


=3 ±2,131(1,1)^^34 

) ’ 

2) H 0 :a lt =0 3)oc=0,05 
H'■ a ,t * 0 



-2,131 


Siendo que a^= 0 , no se situa dentro de los limites de confianza (0,66 y 5,34), se rechaza la hipotesis 
nula y aceptamos la altemativa de que existe una diferencia significativa, al nivel del 5%. 


Nota : Para aceptar la hipotesis nula se requiere que uno de los limites sea positivo y el otro 
negativo. En caso de tener los mismos signos, siempre estaremos rechazando la hipotesis nula. 


Los anteriores procedimientos corresponden a pruebas de diferencias para pares de observaciones, en 
que cada elemento de estudio de la primera muestra se encuentra en la segunda, razon por la cual no 
son muestras independientes. En si hay una sola muestra, no dos como aparentemente se puede pensar, 
por lo tanto se tendra una muestra constituida por la diferencia entre dos observaciones para el mismo 
elemento. Generalmente es aplicado para aquellas observaciones tomadas antes y de spues de cada uno 
de los elementos en la muestra. 


EJERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


29. En un experimento realizado en 10 lotes de terreno, la mitad de cada lote se sembro con una semilla 
resistente al moho y la otra mitad con semilla corriente. Los resultados siguientes (peso del grano 
en libras), ^senalan que existe una diferencia significativa entre ambas semillas? 


Continuation 


LOTE 

ESPECIAL 

CORRIENTE 


LOTE 

ESPECIAL 

CORRIENTE 

1 

49 

47 


6 

49 

44 

2 

58 

57 


7 

66 

67 

3 

53 

49 


8 

55 

52 

4 

60 

57 


9 

44 

42 

5 

45 

44 


10 

52 

53 


30. En un experimento alimenticio apareado, las ganancias de peso (en libras) de cerdos alimentados 
con dos clases de dietas, son las siguientes: 
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PAREJA 

DIETAA 

DIETAB 

1 

25 

19 

2 

30 

32 

3 

28 

21 

4 

34 

34 

5 

23 

19 


^Puede considerarse alguna de las dietas como superior? 

31. En un estudio con mellizos identicos, a uno de ellos se le da una droga y luego se le somete a una 
prueba de inteligencia bajo los efectos de la droga; el otro mellizo es sometido a la prueba sin darle 
droga. Si el experimento se efectua con 6 pares de mellizos y se obtiene una diferencia media de 
5 puntos con una desviacion estandar de 6,48, construya los limites de confianza del 95%, para la 
diferencia media en puntajes. 

32. Una manzana recien descubierta tiene un sabor delicioso. Se ha decidido docimar (someter a 
prueba) su rendimiento, plantando este tipo de manzanas junto a otras corrientes, en ocho huertos 
diseminados en una region apropiada para la produccion de ambas variedades. Cuando los arboles 
empiezan a rendir frutos, se mide su produccion en cajas. Los datos obtenidos son los siguientes: 


HUERTO 

NUEVA 

MANZANA 

MANZANA 

CORRIENTE 

1 

13 

12 

2 

14 

16 

3 

19 

17 

4 

10 

9 

5 

15 

16 

6 

14 

12 

7 

12 

10 

8 

11 

8 


^Senalan estos resultados una mayor produccion para la nueva manzana que para la corriente? 

33. Una compania desea estudiar el efecto que tiene la pausa para el cafe, sobre la productividad 
de sus obreros. Seleccionaron 6 obreros, miden su productividad en un dia corriente y luego la 
productividad de los mismos 6 obreros en un dia en que se concede la pausa para el cafe. Las cifras 
que miden la productividad son las que siguen: 


TRABAJADOR 

SIN PAUSA 

CON PAUSA 

1 

23 

28 

2 

35 

38 

3 

29 

29 

4 

33 

37 

5 

43 

42 

6 

32 

30 


£ Indican estos resultados que la pausa para el cafe aumenta la productividad? 

34. Para analizar dos promisorios nuevos hibridos de maiz bajo condiciones normales de cultivo, una 
compania productora de semillas selecciono aleatoriamente 8 tineas en un departamento del pais y 
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planto ambos hibridos en lotes experimentales en cada finca. El rendimiento en cargas por hectarea, 
en los 8 terrenos, fue: 


FINCA : 

1 

2 

3 

4 

5 

6 

7 

8 

HIBRIDO A : 

86 

87 

56 

93 

84 

93 

73 

79 

HIBRIDO B : 

80 

79 

58 

91 

77 

82 

74 

66 


Construya los limites de confianza del 95%, para la diferencia entre el rendimiento medio de ambos 
hibridos. 

35. A diez atletas se les sometio a un programa de entrenamiento fisico intensivo por parte del preparador fisico. 
Se anotaron sus pesos (en libras) antes y despues de dicho entrenamiento con los resultados siguientes: 


ATLETA : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

PESO ANTES : 

127 

195 

162 

170 

143 

205 

168 

175 

197 

136 

PESO DESPUES : 

135 

200 

160 

182 

147 

200 

172 

186 

194 

141 


^Afecta el programa el peso medio de los atletas? 

36. Suponga que en un colegio oficial de Guayaquil, se estan comparando dos metodos de ensenanza 
utilizando 50 estudiantes divididos en dos grupos con igual numero de alumnos, agrupandolos 
por parejas basados en su coeficiente de inteligencia, de tal manera que cada estudiante del primer 
grupo se analiza con un estudiante del segundo grupo. A1 finalizar el curso se realiza un examen y 
se calculan las diferencias entre las calificaciones apareadas. Los resultados son d= 5,6 y S d = 9,6 
^Al nivel del 5%, puede demostrarse que el segundo metodo es inferior al primero? 

37. Un fabricante de productos alimenticios, hace una prueba previa con cierto tipo de salsa picante 
que puede preparar en una forma mas espesa (x) o en otra forma menos espesa (y). Para medir la 
preferencia por uno y otro tipo de salsa picante, utiliza una muestra de 10 amas de casa, quienes 
manifiestan sus preferencias por dichos tipos de salsa picante, con los siguientes resultados (se 
utilizo una escala de 1 a 10) en puntos. 


AMADE CASA No.: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

SALSA (x) Puntos : 

3 

1 

5 

2 

0 

4 

3 

3 

2 

5 

SALSA ( y ) Puntos : 

2 

4 

4 

7 

3 

4 

6 

5 

5 

8 


Al nivel de significacion del 5%, £se podria concluir que el tipo de salsa menos espesa (y ) tiene 
may ores oportunidades de ser aceptada en el mercado, que el tipo mas espeso (x)? 


38. Una agencia de publicidad, desea probar dos formas diferentes de presentation de un anuncio para 
re vistas de una lotion para hombres. En el anuncio A el producto es enfocado desde el punto del 
sex-appeal. En el segundo anuncio es enfocado desde el punto de revista; despues de un tiempo 
se selecciono una muestra de 12 hombres, usuarios potenciales. El procedimiento seguido en el 
test consiste en dejar que los entre vistados hojeen libremente la re vista y luego se sometan a un 
cuestionario disenado para medir el grado de recuerdo de los anuncios en cuestion. Los resultados 
obtenidos en puntos (usando una escala de 1 a 10) son los siguientes: 


ENTREVISTADO No. : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

ANUNCIO A : 

2 

3 

4 

5 

1 

4 

5 

7 

4 

5 

3 

3 

ANUNCIO B : 

3 

5 

7 

4 

3 

2 

5 

4 

6 

7 

6 

6 
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A1 nivel del 5%, ^podria concluirse que el anuncio B suscita mas atencion que el A? 

39. Una empresa necesita un qulmico y los aspirantes son sometidos a diferentes pruebas 
psicotecnicas, de las cuales una es un test de analisis de un producto. Los dos mejores 
candidatos A y B, han obtenido los resultados siguientes en la prueba del analisis quimico: 


No. DE LA PRUEBA : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

CANDID ATO A : 

20 

17 

18 

20 

19 

18 

19 

20 

19 

20 

CANDIDATO B : 

19 

18 

20 

17 

18 

17 

19 

19 

20 

19 


^Puede considerarse que el quimico Aha realizado mejores analisis que B o viceversa? 


40. La direccion de una empresa de productos dieteticos para ninos desea confrontar las propiedades 
nutritivas de una de sus especialidades con las de un producto de la competencia. Para estos efectos, 
encarga a un medico nutrir 6 ninos con su producto (x) y despues, alimentar a estos mismos ninos 
con el producto de la competencia (y). Se ha decidido que el efecto de las propiedades nutritivas de 
los productos venga medido por el aumento de peso diario de los ninos. 


No. ORDEN NINOS : 

1 

2 

3 

4 

5 

6 

PRODUCTO A : 

21 

20 

20 

22 

16 

21 

PRODUCTO B : 

17 

18 

18 

16 

14 

13 


A1 nivel del 1%, ^existe una diferencia entre el valor nutritivo de los productos? 

41. Un ingeniero industrial, cree que ha perfeccionado un programa de entrenamiento que puede acortar 
el tiempo de ensamble, en forma considerable,para cierto mecanismo. Para verificar esta creencia, 
planea seleccionar diez obreros en forma aleatoria y realizar estudios de tiempo y movimiento con 
ellos antes y despues de que hayan acabado su programa de entrenamiento (el tiempo se tomo en 
minutos). 


No. DE OBREROS : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

lo. ESTUDIO : 

7 

8 

10 

11 

18 

16 

12 

12 

6 

12 

2o. ESTUDIO : 

8 

8 

7 

6 

10 

9 

9 

8 

7 

10 


a) Obtenga los limites de confianza del 99%. 

b) Docime al nivel del 1%, si el programa de entrenamiento resulta de utilidad para reducir el 
tiempo medio de ensamble. 


42. Para comparar la eficiencia de maquinas de escribir corrientes y electricas, se eligen en forma 
aleatoria 8 mecanografas y se las instruye en forma completa para que operen ambos tipos de 
maquinas. Se les pide que escriban en cada tipo de maquina durante diez minutos y se observan sus 
velocidades, que se miden mediante el promedio de palabras escritas por minuto. 


MECANOGRAFANo. : 

1 

2 

3 

4 

5 

6 

7 

8 

ELECTRICA : 

75 

89 

79 

85 

102 

115 

97 

69 

CORRIENTE : 

79 

62 

54 

67 

81 

78 

66 

73 


I Se puede llegar a la conclusion de que los dos tipos de maquinas son diferentes en eficiencia? 
(Nivel del 5%). 
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PRUEBAS NO PARAMETRICAS 


Una buena parte del contenido de este libro, ha sido dedicado al estudio de las distribucionesparametricas, 
probando o docimando suposiciones acerca de la naturaleza de la poblacion, a traves de muestras que nos 
permitan obtener valores o estimativos, llamese media, proportion, varianza, coeficiente de correlation, 
etc. Dado que se trabaja con valores estadisticos de la poblacion, conocidos como parametros, las 
tecnicas empleadas en estos casos, reciben el nombre de parametricas. 

Con las muestras se recoge informacion, algunas veces dificil de cuantificar, por lo tanto utilizamos 
como solution, escalas de medicion de 0 a 5, de 0 a 10, etc. Este problema se presenta en casi todos 
los campos del saber; sin embargo con mas frecuencia en aquellos estudios de comportamiento o de 
conducta, como sucede en las ciencias sociales. Observemos, como ejemplo, lo mas comun que encon- 
tramos en las universidades o institutos, la evaluation periodica del profesor; en la mayoria de los casos, 
su permanencia depende en gran parte de sus alumnos, donde algunas veces se ponen en tela de juicio 
los conocimientos y otros aspectos de caracter academico y personal, pero las opiniones son, de alguna 
forma, consecuencia de la subjetividad por parte de los estudiantes. 

Los metodos no parametricos, son de gran utilidad en este y en muchos otros casos para el analisis 
de los datos, cuando las observaciones se pueden ordenar, ya que son imposibles de medir, tambien cuan- 
do se carece del conocimiento acerca del comportamiento de los parametros de la poblacion. 

Se puede concluir que en todos aquellos casos, donde sea imposible establecer la forma de la distribution 
poblacional o cuando los datos estan dados a escala ordinal, es decir, que pueden ordenarse por rangos, 
se hace indispensable la aplicacion de metodos, denominados de diferentes maneras: no parametricos, 
de distribution libre, de rango o de orden , tecnicas que surgieron a mediados del siglo XIX. 

Entre los numerosos metodos no parametricos sobresalen: 


■ Prueba del Chi 6 J cuadrado. 

i 

■ Prueba de signo, donde solo se toman los signos positivos y negativos de las 
diferencias en las observaciones apareadas. 

■ Metodo de Spearman o Correlation por Rangos, cuando los datos o informacion 
obtenida mediante muestras, se clasifican de acuerdo al rango obtenido. 

■ Prueba T de Wilcoxon, requiere que los datos esten dados a escala ordinal y que las 
dos muestras se relacionen por pares o parejas. 

■ Prueba de U de Mann - Whitney, usada para determinar si dos muestras han sido 
extraidas de una misma poblacion, utilizando la suma de rangos. 

■ Prueba H de Kruskal - Wallis , utilizada para probar si tres o mas muestras 
independientes han sido extraidas de poblaciones con la misma distribution. 


Existen mas pruebas que no se expondran en este capitulo, solo haremos referenda a las ya enun- 
ciadas y las desarrollaremos a continuation. 

PRUEBA DE CHI-CUADRADO % 2 

Corresponde a las distribuciones no parametricas , siendo una de las mas utilizadas, establecida por pri- 
mera vez por Helmert en 1875 y redescubierta en 1900 por Karl Pearson. En 1934, en el caso de tablas 
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de contingencia de “2 x 2”, fue propuesta la aplicacion de la correction por continuidad de Yates, aten- 
diendo la sugerencia hecha por Fisher, pero hoy en dia, es considerada por algunos como innecesaria. 


La distribution normal , se utiliza en todos aquellos casos en que el experimento ofrece dos 
resultados posibles; cuando se presentan mas de dos resultados debe aplicarse la prueba de 
Chi-cuadrado. Un ejemplo tipico de distribucion normal, lo constituye el lanzamiento de una 
moneda con posibilidades de que aparezca cara o sello y la de Chi-cuadrado estara aplicada, 
en el lanzamiento de un dado con seis caras posibles, numeradas del 1 al 6. 


Esta prueba se denomina J. - cuadrado , derivada de la letra griega mayuscula J. que se escribe X y 
que se lee chi; el cuadrado se debe a que la suma de las diferencias entre los valores observados y espe- 
rados sera igual a 0, por lo tanto se hace necesario elevarlos al cuadrado, para cuantificar la diferencia. 

Por definicion, J - cuadrado , es la suma de las fracciones que tienen por numerador el cuadrado 
de las diferencias entre las frecuencias reales u observadas y las frecuencias esperadas o teoricas y por 
denominador la frecuencia esperada. 

n =Frecuencia observada o real 

I o I t 

I F I = n = Frecuencia teorica o esperada 

l_ e J * 

Se puede observar en la formula anterior, que mientras mayor sea la coincidencia entre las frecuen¬ 
cias observadas y las esperadas, menor sera el valor de J. - cuadrado. Si X 2 = 0, significa que hay una 
completa concordancia entre las frecuencias observadas y las esperadas. 


La curva que constituye una excelente aproxima- 
cion a la distribucion J. - cuadrado , esta dada por 
la siguiente ecuacion: 

Donde v es el numero de grados de libertad de la variable y C es una constante que depende de V 
elegida de tal forma, que el area bajo la curva sea igual a uno. 

Esta distribucion es semejante a la distribucion “f’, en cuanto al hecho de que para muestras meno- 
res de 30 unidades no es normal, pero a medida que se aumenta el tamano de la muestra, va ajustandose 
a la normal, por lo cual, habra tambien una distribucion para cada tamano de muestra. 

Esta prueba es realizada, en todos aquellos casos en los cuales el analisis de los datos esta basado 
en el conteo, es decir, provienen de una caracteristica cualitativa ( atributo ), por no ser medidas tal como 
ocurre con la variable. 


g# 

y = c(x 2 ) *e 2 



Para la aplicacion de la prueba de Chi-cuadrado , se debe proceder asi: primero: se formula la hipo- 
tesis, en seguida establecemos las diferencias entre las frecuencias observadas y las esperadas, se eleva 
cada diferencia al cuadrado y se divide a cada una de ellas por su frecuencia teorica o esperada; final- 
mente se suma y de esta manera nos resulta el valor de X , denominada por muchos como J. calculada : 
siendo: 


\r = Y 


(K-fJ 1 

F. I 
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Luego de obtenido el resultado de X 2 podemos especificar un criterio de decision para juzgar si 
las frecuencias observadas, en promedio, difieren significativamente de las frecuencias esperadas. A1 
observar la formula anterior, como ya se dijo, que en aquellos casos en que las frecuencias observadas 
sean iguales a las frecuencias esperadas, la diferencia debe ser igual a cero, por tal razon la suma de 
estas diferencias sera cero y el valor de Chi-cuadrado tambien debe ser cero, lo cual significa que hay 
una completa concordancia. De la misma manera, a medida que aumentan las diferencias, tambien se 
ira aumentando el valor de Chi-cuadrado , como indicador de que hay discrepancias entre lo observado 
y lo esperado. 

Ejemplo 1. Supongamos que se lanza un dado 60 veces. Se sabe que las frecuencias teoricas, para este 
caso, son de 10 veces cada cara y las frecuencias reales son los resultados del lanzamiento. ^Con base en 
un nivel de significacion del 5%, permite suponer que el dado no es perfecto? 


CARAS 


K 




* 

n < 

1 

1 

10 

-3 

9 

0,9 

2 

14 

10 

4 

16 

1,6 

3 

8 

10 

-2 

4 

0,4 

4 

5 

10 

5 

25 

2,5 

5 

16 

10 

6 

36 

3,6 

6 

10 

10 

0 

0 

0 

X 

60 

60 

0 

- 

9,0 


F n 

F,. 

F - F 

o e 

(F„ -Fj 

(F, -Fj 

F e 


Solution: 

El problema nos da las frecuencias reales u observadas (72.) para cada cara, tal como aparece en el 
cuadro anterior. Las frecuencias esperadas se obtienen multiplicando la probabilidad de presenta- 
cion para cada suceso por n (numero de lanzamientos). 

n = np = 60 f — 1= — = 10 y asi sucesivamente se obtienen las demas frecuencias teoricas o 
V 6 y ^ esperadas. 

Se realiza la prueba teniendo en cuenta los siguientes pasos: 

') H 0 ■■"'=< r H 0 -.F n =F c ^ 

Ha-n^n, 'h.-.F^fC 

i_I 

2) oc=0,05 

3 ) Z 2 =l^^ = 9,0 

n ' 

4) v = n - 1 xlos = 11,07 (Vertabla9.3) 

X 1 < Xo,o 5 es decir 9 < 11,07 
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por lo tanto se acepta la hipotesis de que la diferencia no es significativa. En otras palabras, podemos 
afirmar al nivel del 5%, que las diferencias que presentan las frecuencias reales, con relacion a las 
frecuencias teoricas no nos dan base para decir que el dado esta cargado. 


Al utilizar J.-cuadrado para una docima, el rechazo de la hipotesis nula o sea H 0 , se 
presenta cuando el valor de J.-cuadrado calculado mediante la realizacion del expe- 
rimento, es igual o mayor que el valor J.-cuadrado obtenido en la tabla, para ciertos 
grados de libertad y un nivel de significacion fijado de antemano. 


Tabla 9.3 Distribucion de Ji-cuadrado 



Ejemplo 2. De 64 crias en un cruzamiento entre conejos, 34 son rojos, 10 negros y 20 blancos. Conforme 
al modelo genetico, estos numeros deberian estar en la relacion 9:3: 4. ^A1 nivel del 5%, se podria afirmar 
que los datos son consistentes con el modelo? 


Solution: 

9 + 3 + 4=16 P\ =T7 = 0,56 p 2 = j- = 0,19 Pi=tz = °>25 

lo lo lo 


n* = np l = 64 (0,56) =36 n 2 = np 2 = 64 (0,19) =12 n 3 = np 3 = 64 (0,25) =16 

Siendo: v = 3 — 1 = 2 Zoos = 5,99 (J t de tabla 6j, tedrico) 



* 

n , 

11,-n* 


{n,-n ,) 2 

K 

34 

36 

-2 

4 

0,1111 

10 

12 

-2 

4 

0,3333 

20 

16 

4 

16 

1,0000 

64 

64 

0 

- 

1,4444 

K 

F, 

F n -F, 

(F, ~Fj 

(F n ~Fj 

F e 


1 ) H {) : n , = n , 
H a :n,±n* 

2) oc=0,05 


r H 0 -.F o =F e 


n 


j 


3) Z 


^(^-<) 2 1; 


4444 



2 

C omo X =1,4444 se situa en la zona de aceptacion, se puede afinnar al nivel del 5%, que los datos 
son consistentes con el modelo. 
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TABLAS DE CONTINGENCIA 

Las docimas o pruebas aplicadas a cuadms de contingencia, algunos las denominan tambien como do- 
cimas de independencia. Sin embargo, permiten la realization de pruebas de homogeneidad. U n cua- 
dm de contingencia, es un arreglo en el cual un conjunto de observaciones se dispone conforme a dos 
criterios de clasificacion, uno de los cuales se expresa en columnas y el otro en renglones. Si cada uno 
de los criterios admite dos clasificaciones, se obtiene una Tabla de contingencia de “2 x 2”. Si el primer 
criterio admite tres clasificaciones y el segundo criterio 4, se denominate como una Tabla de “3 x 4”. Si 
designamos las columnas por K y los renglones por J, se tendra una Tabla de “K x J”. 

Los grados de libertad seran iguales a v= (K-l) (J- 1), asi que en una tabla de “2 x 2”, el valor de 
v sera igual a 1, 0 sea v = (2 -1) (2 -1); en la tabla de 3x4 sera: v= (3-1) (4-1) = 6. 


Cuando el numero de grados de libertad obtenidos es igual a 1 y la variable es discreta, tal como 
ocurre en la prueba d e Ji-cuadrado, hay necesidad de introducir en los calculos la llamada Correccidn 
de continuidadde Yates, que consiste en restar el valor de 0,5 de valor absolute de las diferencias entre 
las frecuencias observadas y las esperadas, antes de ser elevadas al cuadrado. La formula, aplicando la 
correccion deContinuidad deYatessera: 



\n~n,\ 

-°’ 5 ) 

f 


n 

* 

t 


(K-^l-0,5) 2 


j 2 = X 


n 


j 


Puede observarse que en muestras grandes, se obtienen practicamente los mismos resultados que al 
aplicar la X sin corregir. 


A pesar de que durante mucho tiempo se ha venido utilizando la correccion por continuidad de Ya¬ 
tes, hoy su uso no es relevante pues se ha demostrado que, en la mayoria de los casos, la hipotesis nula 
(H 0 ) no se rechaza con la frecuencia requerida. De ahi que su aplicacion sea limitada. 

Se dice que la correccion debe hacerse, cuando los grados de libertad sean iguales a uno (1), es de- 
cir, se trata de una tabla de “2x2”; tambien se recomienda en aquellos casos en que una de las frecuencias 
observadas sea menor que 10. 


Ejemplo 3. En un consultorio se trato a un grupo de personas que se quejaban de insomnio, dandole a 
unos pastillas para dormir y a otros pastillas de azucar (que hacian creer que eran para dormir). Despues 
de someterlos a observacion, se obtuvo el siguiente resultado. 


TRATAMIENTO 

DURMIERON 

NO DURMIERON 

TOTAL 

Pastillas para dormir 

35 

5 

40 

Pastillas de azucar 

45 

15 

60 

Total 

80 

20 

100 


Pruebe al nivel del 5% que no existe diferencia 
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Solution: 


n. 

i 

n* 

i 

* 

n— n. 

i i 

n- n* - 0,5 

i i i i 7 

CN 

o' 

1 

sf 

1 

(K : -«;]-o,5) 2 
n* 

i 

35 

32 

3 

2,5 

6,25 

0,1953 

45 

48 

-3 

2,5 

6,25 

0,1302 

5 

8 

-3 

2,5 

6,25 

0,7812 

15 

12 

3 

2,5 

6,25 

0,5208 

100 

100 

0 

- 

- 

1,6275 

F 

o 

F 

e 

F-F 

o e 

1 F-F 1-0,5 

i o e i 7 

(^ o -F|-0,5) 2 

(^-F|-0,5) 2 

F 

i 



80 = 32 


_ f 60 " 
1100 , 


80 = 48 


■_( 40 3 

1 l 100 . 


20 = 8 



20 = 12 


a) H 0 :n,=n* 

H „ : n , * «,* 


b) oc = 0,05 


c) Z 2 =I 




1,6275 


siendo v = (2-1) (2-1) = 1 
Zo,05 = 3,84 



d) Se acepta la hipotesis nula H Q : n = n *, la diferencia no es significativa, al nivel del 5%. 

Ejemplo 4. Dos grupos A y B cada uno de 100 individuos, padecen una enfermedad. Se administra un 
suero solo al grupo A; en todo lo demas, los dos grupos fueron tratados identicamente. Se encuentra que 
en los grupos A y B, 75 y 65 individuos, respectivamente, se han recuperado de la enfermedad. 


Probar la hipotesis de que el suero ayuda a curar la enfermedad. ( oc = 0,05 ). 


TRATAMIENTO 

DURMIERON 

NO DURMIERON 

TOTAL 

Grupo A (con suero) 

75 

25 

100 

Grupo B (sin suero) 

65 

35 

100 

Total 

140 

60 

200 


Solution: 


n i 

n i 

n— n* 

i i 

n— n* - 0,5 

i i i i 7 

( h -< l -°’ 5 ) 2 

(|n-«i-0,5) 2 

n* 

i 

75 

70 

5 

4,5 

20,25 

0,2893 

65 

70 

-5 

4,5 

20,25 

0,2893 

25 

30 

-5 

4,5 

20,25 

0,6750 

35 

30 

5 

4,5 

20,25 

0,6750 

200 

200 

0 

- 

- 

1,9286 

F 

o 

F 

e 

F-F 

o e 

1 

T " 

o 

Lh 

I 

o 

Gi 

(N 

o' 

1 

1 


”'=(ll ) l40 = 70 "His ) 140 ' 70 " ;= (®)“ =3 ° 
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1 ) 

2 ) 

3) 

4) 


H 0 \ La recuperacion es independiente del empleo del suero 
H: La recuperacion y el empleo del suero estan relacionados 


oc = 0,05 


93 


V = ( 2 - 1 ) ( 2 - 1 ) = 1 ^, 05 = 3,84 





2 


Aceptamos la hipotesis nula H Q , y se deduce que la recuperacion es independiente del empleo del suero, 
al nivel del 5%. 


2 2 

Nota: con la correccion de Yates siempre se disminuye el valor de X . Observemos el resultado X 
cuando se hace sin correccion. 


n i 

* 

n , 

* 

(«, 


K 

76 

70 

5 

25 

0,3571 

65 

70 

-5 

25 

0,3571 

25 

30 

-5 

25 

0,8333 

35 

30 

5 

25 

0,8333 

200 

200 

0 

- 

2,3808 

F n 

F, 

F, ~ F 

(F n ~Fj 

(F n -Fj 

F e 


X 1 0 Cormgida = 1 , 93 ) 
ft 2 (Sin correccion = 2 , 38 ) 


2 2 

Se podra observar que X < Xo,os, es decir, 2,38 < 3,84 de tal manera que aceptamos que la recupe¬ 
racion es independiente del empleo del suero. 


Un procedimiento mas rapido para realizar la prueba de hipotesis en la distribucion de Ji-cuadrado , 
escomosigue: 2 ^ njAD-BCY 

% m l m 2 m 3 m 4 


Cuando sea necesario aplicar la correccion de Yates, tal como lo habiamos recomendado, para casos 
en que v = 1 o cuando n < 50 y en aquellos casos en que alguna o todas las frecuencias sean menores 
que 5, se procedera asi: 




n ( AD - BC -0,5 n) 


m, m 0 m, m A 


Observemos las letras 6 simbolos anteriores, ^a que valores corresponden en la Tabla de contingencia? 
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Ejemplo 5. Utilicemos las formulas del ejercicio anterior sobre la aplicacion del suero y la recuperacion. 
A =75 B= 25 C =65 D =35 m l = 140 m 2 =60 m 3 = 100 m 4 = 100 n =200 


Solution: 

AD = 75 (35) = 2.625 
BC = 25 (65)= 1.625 

/Wj m 4 =140 (60) (100) (100) = 84.000.000 


2 = n{AD-BCf 200 (2.625-1.625) 2 

/«, /« 2 /« 3 /« 4 * 84.000.000 ° (sin correccion) 

Aplicamos ahora la formula para calcular./ - cuadrado corregida: 

2 «(UD-£C|-0,5«) 2 200 (12.625-1.6251-100) 2 

m l m 2 m 3 m 4 f x 84.000.000 

(corregida) 

Notaremos que los resultados son exactamente iguales a los obtenidos al aplicar la formula general 
de J.- cuadrado , con y sin correccion. 

DOCIMAS DE HOMOGENEIDAD Y DE INDEPENDENCES 

La prueba de homogeneidad se utiliza para determinar, si dos o mas muestras aleatorias provienen de la 
misma poblacion o de poblaciones diferentes. Cuando se dice que las clasificaciones son homogeneas, se 
quiere dar a entender que tienen algo en comun. En cambio, la prueba de independencia es aplicada para 
establecer si hay alguna relacion en cuanto a los criterios de clasificacion de la informacion. 

La diferencia existente entre la docima de independencia y la de homogeneidad, se presenta cuan¬ 
do en la primera interesa saber si un atributo o clasificacion es independiente del otro, y generalmente 
corresponde a resultados obtenidos a traves de una muestra de una poblacion; en la segunda prueba, 
interesa establecer si las muestras provienen de la misma poblacion, por lo tanto estara conformada con 
dos o mas muestras independientes, de cada una de las poblaciones sometidas a estudio. 


Para mayor claridad, se podra decir que en la prueba de independencia, se extrae una 
sola muestra de una poblacion y solo nos interesa probar si existe alguna relacion entre 
los criterios de clasificacion establecidos. Algunos, erroneamente, creen que se trata 
de establecer la relacion o correlacion que puede haber entre las variables; para este 
caso se aplican las tecnicas de regresion y las pruebas de correlacion. 

En la prueba de homogeneidad , al contrario de la de independencia , se extraen dos o 
mas muestras provenientes de dos o mas poblaciones; algunas veces, de una muestra 
se pueden obtener dos o mas categorias y el interes es el de probar si las poblaciones 
tienen cierta identidad con respecto a la caracteristica analizada. 

En resumen, el calculo de Ji-cuadrado es igual para las dos pruebas y se diferencia en cuanto a la 
manera como se recolectan los datos y se interpretan los resultados. 

Ejemplo 6. Una tienda vende lavadoras y aspiradoras electricas y tiene 3 vendedores. Las ventas 
realizadas en un mes por dichos vendedores, son las siguientes: 
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^Demuestra este resultado que la habilidad de cada vendedor depende del tipo de articulo que ven- 
de? Pruebe la hipotesis de homogeneidad al nivel del 5%. 

Solution: 



* 

n , 

n ,-n", 

(n,-n*) 2 

{n,-n*) 2 

K 

20 

19,6 

0,4 

0,16 

0,0082 

17 

17,4 

-0,4 

0,16 

0,0092 

8 

12,7 

-4,7 

22,09 

1,7393 

16 

11,3 

4,7 

22,09 

1,9549 

15 

10,6 

4,4 

19,36 

1,8264 

5 

9,4 

-4,4 

19,36 

2,0596 

81 

81,0 

0 

- 

7,5976 

F„ 

F, 

F - F 

o A a 

(F 0 -Fj 

(F„ -Fj 

f r 


1) 


”' = ( tf ) 37=19,6 ” H §) 37 = 17 ' 4 »>=( f ) 24 

" := (f) 24=lw = (lf ) 20=10 - 6 "Hi ) 20 

H Q : Las muestras se extraen de la misma poblacion. 

H a : Las muestras se extraen de poblaciones diferentes. 


= 12,7 
= 9,4 


2 ) 


3) 

4) 


oc = 0,05 

r ,2 _ V fc ~ PJ 1 


\r = i- 


r = X (n ' 1 ° =7,60 


v = (2-1) (3-1) = 2 


*0.05=5,99 



Zo,o 5 - 5,99, siendo 7,60 mayor a 5,99 se rechaza la hipotesis nula (H 0 ); las muestras se extraen de 
poblaciones diferentes. Tambien podemos contestar que la habilidad de cada vendedor no depende del 
articulo, al nivel del 5%. 
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APLICACIONES DE EXCEL EN PRUEBAS DE 
CHI-CUADRADO 



Consideremos otros dos (2) ejemplos, que serian resueltos mediante la aplicacion de EXCEL. 
n. =F = Frecuencia observada o real 

l o 

n*= F e = Frecuencia esperada o teorica 


Primero: Lanzamiento de un dado 360 veces, que equivale a lanzar 360 dados una sola vez, de esta 
manera se observaran los resultados obtenidos (/?.), los esperados (n*) 9 y ademas, el porcentaje o la 
proporcion de presentation de cada cara ( p). 



Formula: 


_ ^ _ 


z 2 =I 


= 7,60 


n, = np 

Siendo: Tl = 360 y p = 1/6 
n t = 360(1/6) = 360/6 = 60 

Se espera que cada cara se presente 60 veces 
en los 360 lanzamientos. 


Segundo: En Tablas de contingencia , por ejemplo: una tabla de 3 x 3, con la siguiente informacion: 


CARAS 

n , 

< 

P 

1 

56 

60 

0,1666 

2 

58 

60 

0,1666 

3 

62 

60 

0,1666 

4 

64 

60 

0,1666 

5 

61 

60 

0,1666 

6 

59 

60 

0,1666 

Z 

360 

360 

1,000 


VARIABLE 

LINFA 

VARIABLE COLIIMNA 

TOTAL 

T 

M 

N 

A 

400 

200 

100 

700 

B 

300 

350 

150 

800 

C 

300 

450 

250 

1.000 

TOTAL 

1.000 

1.000 

500 

2.500 


Pi = 700/2.500 = 0,28 
A = 700/2.500 = 0,32 
P 3 = 700/2.500 = 0,40 


Para la aplicacion de Excel trabajaremos con la segunda tabla de 3x3: 

□ Lo primero que hacemos es teclear en una hoja electronica la informacion anterior: 

Los pasos a seguir para el calculo de CHI-CUADRADO (X 2 ) son: 

□ Seleccionamos la celda C14 en la hoja de calculo que contiene los datos de la frecuencia 
esperada. 

□ Seleccionamos la option funcion fx, con la cual aparece un cuadro de dialogo correspondiente 
a INSERTAR FUNCION. 

En la SEGUNDA PARTE DEL SIL que acompana al libro, encontrara en conjunto toda la aplicacion del EXCEL a la ESTA- 
DISTICA, que igual al capitulo 13, ofrece una BASE DE DATOS para trabajar. 
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Figura No. 1 .Informacion en Hoja de Calculo. 
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□ Observemos dentro del cuadro de dialogo, el campo C ATEGORIA DE LA FUNCION, en el cual 
seleccionamos la opcion ESTADISTICAS y en el espacio correspondiente a SELECCIONAR 
FUNCION, senalamos la funcion PRUEBA CHICUAD; finalmente hacemos CLIC en 
ACEPTAR. 


Figura No. 2. Insertar Funcion. 
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□ Nos aparece en pantalla un CUADRO DE DIALOGO correspondiente a la funcion PRUEBA 
CHI CUADRADO, que nos solicita informacion sobre los RANGOS: 

□ RANGO ACTUAL, debemos teclear en la casilla respectiva, B3:B11, correspondiente a la 
FRECUENCIAS OBSERVADAS. 

□ RANGO ESPERADO, se teclea C3:C 11, que constituye la FRECUENCIA ESPERADA. 

□ Y, finalmente hacemos CLIC en ACEPTAR. Este proceso se ve en las dos figuras que se 
presentan a continuacion: 


Figura No. 3. Argumentos de la Funcion. 
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SI = {400;300;300;200; 350;450; 100; 150... 
[Si = {280;320;400;280; 320;400; 140; 160... 


= 3,89424E-25 

Devuelve la prueba de independencla: el valor de la distribution chi cuadrado para la estadlstica y los grados adecuados 


Resultado de la formula = 3,89424E-25 

Avuda sobre esta funcion 
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Figura No. 4. Resultados de la Prueba de Chi- Cuadrado. 
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CAPfTULO NUEVE 

OTRAS PRUEBA DE HIPOTESIS 


Ahora vamos a determinar el inverso de una probabilidad dada. Esto es, PRUEBA.CHI.INV, para ello: 

□ Procedemos a seleccionar la CELDA C14 en la hoja de calculo, cuya casilla presentara el valor 
de X calculado. 

□ Hacemos CLIC en la funcion fx. Aparece un cuadro de dialogo correspondiente a INSERTAR 
FUNCION. 

□ En el cuadro de dialogo, CATEGORIA DE LA FUNCION, seleccionamos PRUEBA.CHI.INV 
y hacemos CLIC en ACEPTAR. 


Figura No.5. Insertar Funcion. 
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PRUEBA. CHI 
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PRUEBA. CHICUAD 
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PRUEBA. F 

PRUEBA. F.N 

el 


PRUEBA.CHI.INV(probabilidad;grados_de_libertad) 

Esta funcion esta disponible por compatibilidad con Excel 2007 y versiones 
anteriores. 

Devuelve el inverso de una probabilidad dada, de una cola derecha, en una 
distribution chi cuadrado. 
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□ En la pantalla aparece un nuevo cuadro de dialogo correspondiente a PRUEBA.CHI.INV. En 
este cuadro tecleamos en el primer campo denominado PROBABILIDAD nuestro valor de 
CHI. CUAD del ejercicio anterior, es decir el valor de la celda C14. 

□ Finalmente establecemos los GRADOS DE LIBERTAD, v = (J-l)(k-l) siendo: 

V = ( 3-1) (3-1) =4 , razon por la cual tecleamos en la casilla GRADOS DE LIBERTAD, el 
numero 4 y hacemos CLIC en ACEPTAR. 
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Figura No.6. Argumentos de la Funcion. 
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El resultado anterior, corresponde a una prueba exacta. 




































































































































CAPfTULO NUEVE 

OTRAS PRUEBA DE HIPOTESIS 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

43. Un dado se lanza 100 veces y se obtienen los siguientes resultados: 



CARA: 

1 

2 

3 

4 

5 

6 

nr 

12 

17 

20 

22 

13 

16 


Determine si el dado puede considerarse perfecto, al nivel del 1% de significacion. 

44. En un cruzamiento entre flores roja, rosada y marfil, se obtuvieron los siguientes valores en la 
generacion F r 


FENOTIPO 

NUMERO DE PLANTAS 

Roja 

20 

Rosada 

55 

Marfil 

25 


Basado en estos datos, <j,puede suponerse que la segregacion se ha presentado en la relacion 

Mendeliana simple de 1: 2: 1? 

45. En un experimento relativo al cruce de dos hibridos de especies de flores, se obtuvo el resultado tal 
como se indica a continuacion ^Son estos resultados consistentes con la proporcion esperada 9: 3: 
3: 1? 


FLOR MAGENTA 

ESTIGMA VERDE 

FLOR MAGENTA 

ESTIGMA ROJO 

FLOR ROJA 

ESTIGMA VERDE 

FLOR ROJA 
ESTIGMA ROJO 

120 

49 

36 

12 


46. En cierto cruzamiento de dos variedades de guisantes, la teoria genetica lleva a esperar que la mitad 
de las semillas sean corrugadas y la mitad lisas. En una muestra de 800 semillas se encuentran 440 
corrugadas. 

a) Calculeseel valor de Z 2 

b) Si en una muestra de 400 semillas se cuentan 220 corrugadas, ^sera X 1 la mitad del valor anterior? 

c) M ediante un X no ajustado, calcule la probabilidad de obtener, en un total de 400 semillas, un 
numero de semillas corrugadas que difieran en 20 o mas del valor esperado conforme a la teoria 
(es decir, 200 6 mas y 180 6 menos). Resuelvalo mediante la Distribucion normal. 

47. De 64 crias de un cruzamiento entre conejillos de Indias, 34 son rojos, 10 negros y 20 blancos. 
Conforme al modelo genetico, estos numeros deberian estar en la relacion: 9: 3: 4. ^Los datos son 
consistentes con el modelo? 

48. Durante una epidemia de fiebre amarilla se obtuvieron los siguientes datos, sobre la efectividad de 

una vacuna como medida preventiva. 
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TRATAMIENTO 

ENFERMOS 

NO ENFERMOS 

Vacunados 

192 

4 

No vacunados 

113 

34 


Estos datos /,indican la efectividad de la vacunacion con base en el nivel de significacion del 1 %? 


49. Se clasifican 50 individuos conforme al color de los ojos y del pelo. Con los datos mencionados 
^puede concluirse que en estos individuos existe una relacion significativa entre ambas propiedades? 


COLOR 

PELO CLARO 

PELO OSCURO 

Ojos azules 

23 

7 

Ojos castanos 

4 

16 


50. U n grupo de 100 hombres y 100 mujeres son entrevistados respecto a su interes en cierto programa 
radial. 65 hombres no escuchan el programa y 35 si, 80 mujeres no lo oyen y 20 son auditoras. 
^Existe una diferencia significativa entre los habitos de este grupo de hombres y mujeres respecto 
al programa? ( oc = l%) 

51. Los siguientes datos muestran el efecto de cierto tipo de fumigacion sobre el deterioro de la fruta. 


PROCESO 

DETERIORADA 

SANA 

TOTAL 

Sin fumigar 

8 

16 

24 

Fumigada 

2 

14 

16 

Total 

10 

30 

40 


I Depende la cantidad de fruta deteriorada de su fumigacion? ( oc = 2 %) 

52. Un grupo de 30 hombres y 80 mujeres expresan su preferencia por el aroma de dos tabacos para 
pipa. Los resultados son los siguientes: 


SEXO 

MARCA A 

MARCAB 

TOTAL 

Hombres 

9 

21 

30 

M ujeres 

8 

72 

80 

Total 

17 

93 

110 


^Existe alguna diferencia significativa en cuanto a las preferencias por el aroma? 
(Nivel de significacion 5%). 


53. En tres grupos de personas, elegidas en diferentes regiones geograficas, la distribution del color del 
pelo es: 


GRUPOS 

PELO ROJIZO 

PELO CLARO 

PELO OSCURO 

TOTAL 

Grupo A 

2 

9 

9 

20 

Grupo B 

3 

6 

21 

30 

Grupo C 

15 

15 

20 

50 

Total 

20 

30 

50 

100 


^Indican estos datos que el color del pelo depende de la region geografica? (Use un nivel de 
significacion del 1%). 


54. El gerente de ventas de cierta compania esta interesado en probar si los vendedores son igualmente 
ambiciosos, energicos, imaginativos, etc., realizan igual numero de visitas durante el mismo tiempo. 

































CAPfTULO NUEVE 

OTRAS PRUEBA DE HIPOTESIS 


El numero de ventas que realiza un vendedor, por lo general depende del numero de visitas. Se 
selecciona una muestra aleatoria de 6 registros de los vendedores en una semana dada y se halla que 
se realizo un numero total de 210 visitas, distribuidas de la siguiente forma: 


VENDEDORA 

A 

B 

c 

D 

E 

F 

Total 

NO. DE VISITAS 

35 

20 

47 

32 

51 

25 

210 


55. Una estadistica de accidentes leves, ocurridos en dos fabricas Ay B muestran que de 102 accidentes, 
59 han tenido lugar en la fabrica A y 43 en la fabrica B. Formulemos la hipotesis de que no existe 
relacion entre el numero de accidentes y el hecho de que ocurran en la fabrica A o en la fabrica B 
(hipotesis nula). 

56. El servicio comercial de una compania, ha determinado las cuotas para cada una de las cinco 
regiones donde posee sucursales. Este servicio puede suponer que el numero de articulos de 
sonido digital vendidos por region, durante la semana en cuestion no esta conforme con las cuotas 
de reparto? (oc =1%). 


REGION 

NUMERO DE ARTICULOS 

VENDIDOS 

CUOTAS 

AALCANZAR 

Costa A tlantica 

61 

18% 

Antioquia 

83 

30% 

Santanderes (oriente) 

54 

21% 

Centro del pais 

46 

17% 

Valle (Occidente y Sur) 

56 

14% 

Total 

300 

100% 


57. Dos procedimientos de fabricacion, A y B, han sido ensayados con el fin de aumentar la duracion 

de la conservacion de productos enlatados. Los resultados obtenidos son los siguientes: 


PROCEDIMIENTOS 

FRACASOS 

EXITOS 

TOTALES 

A 

77 

63 

140 

B 

54 

66 

120 

Total es 

131 

129 

260 


iA que conclusion podemos llegar? ( oc = 0,05) 


58. En una operacion de control, se clasifican las piezas producidas por cuatro maquinas en tres grupos, 
segun su calidad (buenas, regulares y malas). A1 nivel del 2%, segun los resultados obtenidos ^puede 
admitirse que la distribucion de las piezas buenas, regulares y malas es la misma, independientemente 
de la maquina que las fabrica? 
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59. Se eligen 1.100 personas al azar de una gran ciudad y se les interroga acerca de sus habitos de fumar 

y beber. Los resultados de la encuesta fueron: 


BEBER 

FUMAR 

TOTAL 

% 

Nunca 

Ocasional¬ 

mente 

Moderada- 

mente 

Excesiva¬ 

mente 

Nunca 

85 

23 

56 

36 

200 

18,18 

Ocasionalmente 

153 

44 

128 

75 

400 

36,36 

M oderadamente 

128 

26 

101 

45 

300 

27,28 

Excesivamente 

134 

7 

15 

44 

200 

18,18 

Total 

500 

100 

300 

200 

1.100 

100,00 


iQue conclusion debe deducirse respecto de los habitos de fumar y beber, entre los habitantes de la 
ciudad? ( a = 0,05). 


60. Se elige una muestra aleatoria de 200 alumnos, cada una de cuatro clases de estudiantes no 
graduados. Se pregunta a cada alumno su preferencia por el ajedrez, futbol y tenis, los resultados 
son: 


CURSO 

PREFERENCIA 

TOTALES 

Ajedrez 

Futbol 

Tenis 

1° Ano 

51 

110 

39 

200 

2° Ano 

74 

106 

20 

200 

3° Ano 

25 

124 

51 

200 

4° Ano 

90 

60 

50 

200 

Totales 

240 

400 

160 

800 


iTienen los cuatro cursos la misma preferencia? ( oc = 0,05). 

61. Contestar si es cierto o falso, a los siguientes puntos: 

□ X 2 puedetener valores negativos 

□ Si se tienen 4 filas y 3 columnas, los grados de libertad son 5. 

□ La suma de los valores esperados es igual a la suma de los valores observados. 

□ En el caso de independence, los totales de las filas y de las columnas se obtienen al azar. 

□ En el caso de homogeneidad, los totales de las filas son numeros elegidos 

□ La correccion de Yates se hace solamente cuando el numero de grados de libertad es igual a 1. 

62. Aplicar el test de homogeneidad, al caso referente al recuerdo de un slogan publicitario en una 
muestra de 374 estudiantes: 276 hombres y 98 mujeres; de los cuales 209 varones y 65 mujeres 
recordaron el slogan. Determinarsi esta proporcion permitesostener la hipotesis, deque el recuerdo 
no es igual en hombres y mujeres, a un nivel de 10%. 

63. Un analista de mercados, tiene el problema de si las amas de casa que no se encuentran en ella 
cuando llaman los sondeadores, difieren en sus opiniones acerca de un determinado producto. 
Para comprobar esta posibilidad, los sondeadores regresaron a las casas hasta que obtuvieron una 
entrevista. Los resultados fueron: 
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OPINION 

DELPRODUCTO 

OPINION 

TOTAL 

% 

Primera llamada 

Llamadas posteriores 

Excelente 

62 

36 

98 

0,36 

Satisfactorio 

84 

42 

126 

0,47 

No satisfactorio 

24 

22 

46 

0.17 

Totales 

170 

100 

270 

1,00 


Probar si las amas de casa que no se encontraron, tienen la misma opinion que las que si se encon- 
traron ( oc = 0,05 ). 

64. A 400 personas de ambos sexos, se les dio a probar margarina y mantequilla y se les pidio que 
expresaran su preferencia. ^A1 nivel del 5%, se puede afirmar que se diferencian significativamente 
las preferencias de I os hombres y de las mujeres respecto a dichos productos? 


SEXO 

MARGARINA 

MANTEQUILLA 

Hombres 

86 

74 

M ujeres 

144 

96 


65. Dos operadores de una maquina, A y B, produjeron cierto articulo con el consiguiente numero de 

defectuosos. 


RESULTADOS 

A 

B 

Defectuosos 

40 

60 

No defectuosos 

300 

500 


/,Existe alguna diferencia entre la proporcion de defectuosos para los dos operadores? (Nivel del 1%). 

66. De acuerdo a experiencias pasadas, la distribucion en porcentajes de la opinion sobre determinada 

fabrica ha sido la siguiente: 



Una muestra de 3.030 personas presentan opciones asi: 


OPINION 

PERSONAS 

a 

2.573 

b 

292 

c 

124 

d 

41 

TOTAL 

3.030 


445 


/,Cree usted, al nivel de 10%, que los porcentajes de opinion son aun los mismos? 
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67. Numero de incendios en cierta ciudad, durante una semana: 


LUNES 

MARTES 

MIERCOLES 

JUEVES 

VIERNES 

SABADO 

DOMINGO 

TOTAL 

8 

7 

9 

6 

13 

12 

10 

65 


Verificar que los incendios no estan homogeneamente distribuidos en la semana. (Nivel del 5%). 


68. Se toma una muestra de 220 estudiantes de la facultad de Mercadotecnia y se clasifican de acuerdo 
a las calificaciones y sexo, como sigue. 


CALIFICACION 

HOMBRES 

MUJERES 

A prueban 

110 

80 

Reprueban 

20 

10 


A un nivel de significacion del 5%, ^hay alguna relacion entre sexo y la aprobacion de curso? 

69. Se toman muestras, aleatorias entre bebedores y no bebedores, clasificandolos de acuerdo con sus 

habitos de fumar, como sigue: 


HABITO DE FUMAR 

BEBEDORES 

ABSTEMIOS 

Fumadores en exceso 

40 

20 

Fumadores promedio 

60 

40 

Poco fumadores 

80 

40 

No fumadores 

10 

60 

Total 

190 

160 


^Existe alguna diferencia en la distribucion de los fumadores entre bebedores y abstemios? (Nivel 
del 5%) 

70. En tres ciudades: Bogota, Medellin y Cali, se seleccionaron muestras aleatorias de 240, 200 y 160 
personas: respectivamente. Se les pregunto que tipo de programa de television preferian: novel as, 
musicales, ciencia ficcion o comedias. Las respuestas fiieron: 


TIPO DE PROGRAMA 

BOGOTA 

MEDELLIN 

CALI 

TOTAL 

Novelas 

70 

40 

40 

150 

M usicales 

100 

80 

60 

240 

Ciencia ficcion 

40 

50 

30 

120 

Comedias 

30 

30 

30 

90 

Total 

240 

200 

160 

600 


A1 nivel del 5%, probar la hipotesis de que las preferencias por el tipo de programa son las mismas 

en las tres ciudades. 


71. Se toma una muestra aleatoria de 230 pacientes que sufren cierta enfermedad y se clasifican de 
acuerdo al tratamiento por cierto metodo y su recuperacion es: 


PACIENTES 

CURADOS 

NO CURADOS 

T ratados 

140 

30 

No tratados 

20 

40 


iExiste alguna relacion entre el tratamiento y la curacion de los pacientes? (a = 1%). 
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72. Diga si son ciertos o falsos, los siguientes puntos: 

a) Si se tienen 4 filas y 3 columnas, lo grados de libertad son 5. 

b) Z 2 puedetener valores negativos. 

c) Si se tiene una tabla de “2x2”, los grados de libertad son de 1 y se debe utilizar la correccion de 

Y ates. 

d) La suma de los valores esperados puede ser diferente a la suma de los valores observados. 


73. 


Se desea saber si existe alguna relacion entre las diferentes clases de fumadores y la posicion 
familiar. 


CARACTERfSTICAS 

POSICION FAMILIAR 

Padres 

Hijos 

No fumadores 

8 

30 

Ocasionales 

10 

24 

Habituales 

40 

56 

Exfumadores 

20 

12 


(Nivel del 5%) 


74. Se tomo un grupo de 160 animales para probar el efecto de una vacuna contra una enfermedad 
particular. De los 100 vacunados, 30 resultaron enfermos. De los no vacunados, 36 enfermaron. 
^Que se puede opinar de la efectividad de la vacuna? (Nivel del 10%). 


75. Se toma una muestra de 200 ninos a fin de determinar si el resultado (positivo o negativo) guarda 
relacion con la aplicacion de una vacuna. 


RESULTADOS 

VIA DE APLICACION 

* Intradermica 

**Escarificacion 

Positivo 

30 

20 

Negativo 

70 

80 


Aplique el nivel del 5%, para probar si existe alguna diferencia significativa, en los resultados obtenidos. 
* Interior de la piel ** Incisiones superficial en la piel 

76. Suponga que se tienen los siguientes resultados de una muestra aleatoria de 1.500 electores en un 
barrio de la ciudad, clasificados por afiliacion de partidos y preferencia sobre determinado programa. 


RESULTADOS 

PREFERENCIA 

Pro 

Contra 

G obi erni stas 

600 

375 

Oposi tores 

225 

300 


Probar la hipotesis, al nivel del 5%, de que la afiliacion al partido no tiene que ver con la preferencia 

de voto. 


77. Un almacen desea determinar si el sexo de sus posibles clientes guarda relacion con los articulos 
que vende. 


ARTICULOS 

SEXO 

Masculino 

Femenino 

Ne veras 

380 

400 

Radios 

260 

300 

Tel evi sores 

270 

350 
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Para esa muestra de 1.960 clientes, al nivel del 5% probar la hipotesis de que el sexo no tiene 

relacion con la preferencia. 

78. Con el objeto de investigar la relacion existente, entre los niveles de ingreso y el nivel de sintonia de 
los noticieros de television, se selecciona una muestra de 861 televidentes, estratificados por niveles 
de ingreso. Los resultados obtenidos son: 


NIVEL 

DE INGRESO 

TELEVIDENTES 

Total 

Frecuente 

Ocasional 

Nunca 

Alto 

220 

70 

30 

320 

M ediano 

131 

o 

o 

i— i 

80 

311 

Bajo 

30 

80 

120 

230 

Total 

381 

250 

230 

861 


De acuerdo a lo anterior, pruebe que existe alguna relacion entre los niveles de ingreso y la 

teleaudiencia en los noticieros, al nivel del 1%. 

79. Por experiencia, en las ventas de televisores a color, se sabe que los porcentajes de preferencia 

segun el tamano de la pantalla es el siguiente: 

_ 14" el 18% 16" el 22% _ 19" el 40% 21" el 20% _ 

Se realizo una muestra aleatoria en 200 compradores de este articulo y se obtuvo la siguiente infor- 

macion: 

14” un total de 42 compradores. 16” un total de 40 compradores. 

19” un total de 88 compradores. 21” un total de 30 compradores. 

/,Cree usted, al nivel del 5%, que la preferencia por los tamanos de las pantallas es el mismo? 

80. Se ha solicitado a 4.000 propietarios de vivienda, adquirida en los dos ultimos anos que senalen la 
razon principal por la cual la han comprado. Las dos principales razones son: 


SEXO 

RESPUESTA 

Acabado 

Precio 

M asculino 

950 

550 

Femenino 

850 

1.650 


Pruebese con oc = 0,05 el supuesto de que la respuesta es independiente del sexo del propietario 
entrevistado. 

81. En una investigacion de opinion publica, se hizo a 1.000 habitantes de una ciudad la siguiente 
pregunta: ^como calificaria el desempeno del senor X, como alcalde de la ciudad: bueno, regular, 
malo? Las respuestas, clasificadas de acuerdo al nivel educativo de los encuestados, fueron: 
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Utilizando un nivel del 5%, ^podemos concluir que la calificacion de su desempeno es independiente 

del nivel educacional delos encuestados? 

82. El “temor a un examen” es una emocion que experimentan muchas personas, de todos los grupos de 
edad. Una encuesta a 276 individuos pertenecientes a cada uno de cinco grupos de edad, arrojo los 
siguientes resultados: 


GRUPOS 

PRIMARIA 

SECUNDARIA 

TECNOLOGICA 

UNIVERSITARIA 

ESPECIALIZACION 

Numero de temerosos 

74 

56 

50 

54 

42 


Pruebe, al nivel del 5%, la afirmacion de que cada grupo de edad teme igualmente a los examenes. 


83. En un estudio sobre delincuencia juvenil, se clasificaron 100 jovenes, en edad escolar, de acuerdo 
con el grado de delincuencia y el contacto con los padres durante los ratos libres. iProporcionan 
estos datos evidencia suficiente, como para indicar que hay una relacion en cuanto a los criterios de 
clasificacion? Nivel del 5%. 


TIEMPO LIBRE COMPARTIDO 
CON EL PADRE 

DELINCUENTES 

NO DELINCUENTES 

TOTAL 

Alto 

10 

29 

39 

Bajo 

20 

41 

61 

Total 

30 

70 

100 


84. Se ha tornado una muestra de cada una de dos maquinas que envuelven caramelos: 


MAQUINA 

ROSA 

LILA 

AMARILLO 

ANARANJADO 

VERDE 

BLANCO 

A 

11 

77 

6 

5 

3 

3 

B 

6 

7 

10 

7 

6 

6 


Pruebese la independencia de la mezcla de colores con la maquina que los envuelve, con oc= 0,01. 


85. El numero de reclamaciones recibidas en 5 establecimientos de una cadena de tiendas, por concepto 

de mercancia equivocada o defectuosa en un cierto mes del ano, es la siguiente: 


TIENDA No. 

1 

2 

3 

4 

5 

RECLAMACIONES 

63 

78 

54 

49 

56 


Sobre la base de estos resultados, <jes sostenible la hipotesis de que el numero de reclamaciones que 
recibe cada tienda, es aproximadamente el mismo? (oc = 0,05) 


86. Los siguientes datos muestran el efecto de cierto tipo de fumigacion sobre el deterioro de la fruta. 
Siendo una tabla de “2x2”, se obtuvo la siguiente informacion. 

m l = 10 m 2 = 30 m 3 = 24 m 4 = 16 n = 40 AD = 112 BC = 32 

Al nivel del 5%, ^depende la cantidad de fruta deteriorada de su fumigacion? 

87. En un semestre, se ofrecieron siete secciones de un curso particular de matematicas. Se programaron 
diversas horas, con distintos profesores. A continuacion se presenta el numero de alumnos que 
eligieron cada una las siete secciones: 
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SECCION 

1 

2 

3 

4 

5 

6 

7 

Total 

NO. ALUMNOS 

18 

12 

25 

23 

8 

19 

14 

119 


^A1 nivel del 5%, indican los datos que los alumnos muestran preferencia por algunas secciones? 


DOCIMA O PRUEBA DEL SIGNO 


La prueba del signo es el metodo noparametrico mas sencillo, se emplea de preferencia, cuando se ob- 
servan numeros pares en condiciones diferentes, utilizando unicamente el signo de las diferencias entre 
las observaciones apareadas. 

El analisis estadfstico que no depende del conocimiento de la distribucion, ni de los pa- 
rametros de la poblacion, se denomina metodo no parametrico o de distribucion libre. 


Esta prueba es aplicada, en aquellos experimentos cuyos resultados son observados antesy despues) 
por lo tanto tal como se trabaj6 en observaciones apareadas, se establece la diferencia para cada par de 
observaciones, pero solo tomando el signo, de ahf que se denomin z prueba del signo, disenada en espe¬ 
cial para distribuciones no parametricas. 

L a docima del signo es usada erroneamente en distribuciones parametricas, debido a la facili dad de 
calculo. Sin embargo, se recomienda evitar su aplicacion y solo debe utilizarse en casos extremos, ya que 
esta prueba no es tan eficiente como las parametricas, con frecuencia conlleva a aumentar considerable- 
mente la posibilidad de cometer error de tipo II (aceptar algo falso). Ademas, para ser utilizada requiere 
que n (el numero de pares), sea relativamente grande, 15 o mas pares. 

AI suponer que las dos poblaciones tienen medias identicas, el numero de signos positivos debe ser 
aproximadamente igual al numero de signos negativos. 

Se designa p = 1/2 (signos positivos), q = 1/2 (signos negativos) y D. la diferencia entre x y y. 
Se cuenta el numero de signos positivos y negativos; la suma corresponde a n, es decir, se excluyen las 
diferencias igual es a cero. M ediante la Distribucion binomial se puede obtener la probabilidad (dado el 
supuesto de igualdad de presentacion de los signos positivos y negativos), de que aparezcan mas signos 
positivos, negativos o que la diferencia sea significativa. La simbologia a utilizar en este metodo sera: 

p = 0,5 Probabilidad de presentacion del signo positivo. 

q = 0,5 Probabilidad de presentacion del signo negativo. 

n Suma del numero de positivos mas los negativos, excluyendo los ceros. 

x El numero de signos positivos (puede ser considerado el numero de signos 

negativos). 


La information anterior permite utilizar la Distribucion binomial, pero es preferi ble trabajar con la 
Distribucion normal, a fin de agilizar el procedimiento; para ello se debe recordar el proceso a seguir, 
para calcular la media y desviacion estandar en una Distribucion binomial. 


p = Media de la distribucion binomial —» p = np 
G = Desviacion tipica en la distribucion binomial — » a = -J,n~pq 
X= Valor de la variable. (Numero de positivos o negativos) 
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Se debe tener en cuenta quex, puede corresponder al numero de signos positivos o negativos. Sin 
embargo, es preferible trabajar con el numero de positivos, observando que si es mayor que/i se le debe 
restar 0,5; Si por el contrario es menor que^ se le suma 0,5 al valor de X, uno de los componentes de la 
formula para la distribucion normal. 


L a variante estadistica estara dada: 


X-fi 

o 


D= La diferencia entre x. y y., se tomara unicamente el signo de cada par. 


Recordemos que la prueba de significacion depende de los signos y no de las magnitudes entre 
ciertas cantidades. 


Ejemplo 1. Se detallan a continuacion los rendimientos de dos tipos de maiz, germinados sin mezclas, 
obtenidos en diferentes experimentos. ^Existe alguna diferencia significativa entre ambos tipos de maiz? 
(Nivel del 5%) 



Solution: 


n — 1 6 p — 1/2 q— 1/2 X = 11 (Numero de+) 


H = np =16 (1/2) = 8 o = pnpq = ^16 (1/2) (1/2) = 2 

Mediante la Distribucion normal, como aproximacion a la Binomial, tenemos que: 


X-ju 

o 
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Se acepta la hipotesis nula, ya que 1,25 se ubica en la zona de aceptacion, se dice entonces, que la 
diferencia entre ambos tipos de maiz no es significativa, al nivel del 5%. 

Nota : se toma 10,5, correspondiente al limite inferior de X = 11; por ser 11 mayor que 8 
(valor de ju). Recordemos que la distribucion binomial requiere que la variable sea dis- 
creta y al utilizar la normal, se le debe convertir en continua. 


El problema se hubiera podido resolver utilizando el numero de signos negativos como X. Obser- 
vemos el procedimiento a seguir: 


1) H 0 :P = 1/2 

H a :P* 1/2 

3) o=2 


2) oc =0,01 


4) Z = ——— = ^r—^ = -1,25 



-2,57 


Se acepta H 0 , la diferencia no es significativa, al nivel del 5%. 

Otro procedimiento de calculo 


2,57 


Existe otro procedimiento mucho mas facil en la aplicacion de la docima del signo y en considerar, en 
primer lugar, el numero de veces que ocurre el signo menos frecuente, simbolizado por p. El ejercicio en 
consideracion presenta 5 signos negativos, por lo tanto p = 5. 


El valor critico para una docima bilateral, con un nivel de significacion del 5%, se puede obtener 
mediante la aplicacion de la formula siguiente: 


k = ( n _ V _ (0,98) 


reemplazando se tiene: 


£ = ^-^-0,98^16+1 =7,5 -0,98 ( ,12 ) = ,6 


Es necesario aclarar, que esta formula solo se aplica en pruebas bilaterales, con un nivel de significacion 
del 5%. 


Si S < k se rechaza la hipotesis nula, ahora si S > k se acepta H Q . Teniendo en cuenta el 
ejercicio anterior donde 5 > 3,46, es decir que S > k, se acepta la hipotesis nula, o sea que 
no existe una diferencia significativa. 


Ejemplo 1. Se detallan a continuacion los rendimientos de dos tipos de maiz, germinados sin mezclas, 
obtenidos en diferentes experimentos. ^Existe alguna diferencia significativa entre ambos tipos de maiz, 
con base en el nivel de significacion del 1%? 



Continua... 
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7 

28,9 

38,6 

21 

27,4 

28,0 

8 

35,9 

37,3 

22 

28,0 

28,7 

9 

39,2 

42,6 

23 

28,3 

28,8 

10 

47,8 

46,1 

24 

26,8 

26,8 

11 

42,1 

43,4 

25 

422 

422 

12 

47,6 

482 

26 

38,9 

39,1 

13 

26,4 

26,3 

27 

39,0 

39,4 

14 

30,6 

31,7 

28 

33,6 

34,0 


Solution: 



Para obtener el valor de n , se toman unicamente los signos positivos y negativos. 
Signos positivos = 5 Signos negativos = 21 n = 26 



-2,57 2,57 


1) H 0 :P = 0,5 2)oc = 0,01 3) 0=2,55 

H a \P± 0,5 

Continua... 


453 
























454 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


X-jll _ 5,5-1 
a ~ 2,55 


-2,9 


Se rechaza la hipotesis nula a un nivel de significacion del 1%. Se acepta que existe una diferencia 
significativa entre ambos tipos de malz. 


El ejercicio anterior se puede resolver aplicando la siguiente formula; en el caso de utilizar un nivel 
de significacion del 5% y si la prueba es bilateral. 

K = (26 2 ~ - 0,98 V26 +1 = 12,5 - 5,09 = 7, 1 

El numero de signos positivos es el menos frecuente; en total 5 y lo simbolizamos por p. 

Siendo S = 5, nos encontramos que S <k, por lo tanto rechazamos la hipotesis nula. 


„ n-l I - 7 

K = - yjn +1 


Ejemplo 2. Se realiza un experimento apareado de alimentacion de cerdos, para determinar el valor 
relativo de calizas y harina de hueso, en el desarrollo oseo. En cada par se registra, en porcentaje, el con- 
tenido de ceniza en omoplatos, denominando con X los cerdos alimentados con calizas y con y aquellos 
alimentados con harina de huesos. Si se realizan 35 experimentos, en 27 de los cuales X es mayor que Y y 
en 3 pares de observaciones, X es igual a Y. Senalar en el resultado que la caliza produce mayor contenido 
de ceniza que la harina de huesos. (Nivel del 5%) 


Solution: 

Signos positivos = 27 
p- 0,5 q = 0,5 


Signos negativos = 5 


p=np = 



n = 32 


° = 2 (!)(!)= 23 

H 0 :P = 0,5 2) « = 0,05 

H a -.P> 0,5 

a = 2,8 

ry_X-p _ 26,5 -16 _ 



1,65 


Aceptamos que la caliza produce mayor contenido de ceni¬ 
za que la harina de huesos, al nivel del 5%. 


La prueba del signo se debe aplicar en todos aquellos casos, en los cuales no nos interesa la 
mensurabilidad de los datos, sino su comparabilidad, cuando las observaciones estan dadas 
en condiciones diferentes, por lo tanto se tienen distribuciones diferentes. 


Ejemplo 3. Un experimento apareado realizado a 25 alumnos, sobre el rendimiento academico obtenido 
en una asignatura, aplicando dos sistemas de evaluacion diferentes, arrojo los siguientes resultados: 

Positivo =13 pares Cero = 7 pares Negativo = 5 pares 

^A1 nivel 5%, se puede afirmar que hay una diferencia significativa en la aplicacion de los dos sis¬ 
temas? 
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Solution: 
n = 1 +5 = 18 


77 = 18 


^ =18(1/2) = 9 
{l = np 


a = yfnpq 

a = +18 (1/2) (1/2) = v+5 = 2,12 


Como X > ju, es decir, 13 > 9, se le resta 0,5 a X, siendo X = 12,5. Por lo tanto se tendra que: 



Como 1,65 cae en la zona de aceptacion, se acepta H 0 , por lo tanto la diferencia entre los dos siste- 
mas no es significativa, al nivel del 5%. 


En una hipotesis, correspondiente a una prueba bilateral, con un nivel de significacion del 5%, se 
puede emplear la siguiente formula: 


_ ( 0>98 ) 


K= 11^31 _ (0,98) 718+1= ,7 


Observando que el signo negativo es menos frecuente, se tendra que 5 = 5. Ahora si S > k se acepta 
la hipotesis nula (5 > 4,73), aceptando que la diferencia entre los dos sistemas no es significativa. 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

88. En un experimento apareado {no parametrico) se dan las velocidades {en numero de elementos 
empaquetadospor hora) por dos sistemas distintos. Docime a un nivel del 5% que el primer sistema 
es superior. 




Continua... 
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13 

14 

14 

14 

13 

8 

15 

14 

10 

16 

12 

8 

17 

14 

7 

18 

12 

7 

19 

15 

12 

20 

15 

15 


89. Los pesos, en libras, de 20 personas antes y despues de haberse sometido a una dieta, cuya duracion 
es de dos semanas, son: 


PERSONAS 

PESO (en libras) 

Antes 

Despues 

1 

186 

175 

2 

147 

144 

3 

128 

125 

4 

167 

167 

5 

183 

182 

6 

176 

177 

7 

159 

154 

8 

212 

203 

9 

192 

187 

10 

177 

169 

11 

158 

158 

12 

204 

197 

13 

188 

182 

14 

157 

160 

15 

189 

181 

16 

149 

151 

17 

172 

169 

18 

185 

184 

19 

191 

187 

20 

200 

195 


Utilizando la docima del signo y un oc = 5 %, docimar la hipotesis de que la dieta no es efectiva. 

90. Las parejas de 15 matrimonios fueron sometidas a un “test” relativo al sentido del humor de una 
persona. Utilizar la docima del signo, con una altemativa de que, en promedio, no hay diferencia en 
el sentido del humor de esposos y esposas, con base en los siguientes resultados obtenidos. 


PAREJAS: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

Esposo: 

56 

90 

38 

47 

85 

49 

55 

58 

68 

74 

83 

87 

60 

31 

89 

Esposa: 

49 

88 

51 

50 

83 

41 

52 

69 

83 

89 

77 

62 

65 

44 

92 


91. El numero de piezas defectuosas producidas por dos maquinas durante el mes de septiembre de 
2011 fueron: 
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Atendiendo a que los metodos corrientes (parametricos) no pueden utilizarse, debido a que en los 
dias se emplearon materias primas diferentes, utilizar la prueba del signo, una alternativa bilateral 
y un nivel de significacion del 5%, para docimar la hipotesis de que no hay diferencia significativa. 

92. Clasificaciones de dos grupos de personas con cualidades de liderazgo (datos hipoteticos): 



Aplique la prueba del signo y la normal (observaciones apareadas), para determinar si las diferen- 
cias son significativas. (Nivel del 5%). 

93. El gerente de produccion de una empresa, desea realizar un experimento para comparar dos metodos 
de ensamble de cierto mecanismo. Se seleccionan 18 pares de obreros, apareandose de acuerdo a la 
edad, se les asignan los metodos en forma aleatoria. 



Probar la hipotesis, al nivel del 5%, de que los datos anteriores indican una diferencia significativa. 

a) Utilizar la prueba del signo. 

b) Utilizar el metodo de las observaciones apareadas. 

94. Se realiza un estudio de tiempos y movimientos, con el fin de probar la eficiencia de dos 
procedimientos al realizar ciertos trabajos en una entidad bancaria. Se aparean los empleados con 
base en los coeficientes de inteligencia y el numero de anos de estudio. Los miembros de cada par 
son asignados en grupos a uno de los dos procedimientos. El tiempo establecido en segundos para 
realizar el trabajo es el siguiente: 
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a) Aplique la prueba del signo, para determinar si la diferencia entre los procedimientos es 
significativa. 

b) Aplique la prueba “f ’ para observaciones apareadas, a fin de determinar si la diferencia es 
significativa. 

c) Compare los resultados anteriores obtenidos. 

d) Fije los limites de confianza del 99% para los puntos (a) y (b). 

95. En un estudio para determinar el efecto de una droga sobre la agresividad, se formaron dos grupos 
y se aparearon; al grupo A se le suministro la droga y al grupo B se le dio una droga que no 
producia ningun efecto. Inmediatamente despues de administer la droga, se realizo una prueba 
para comprobar la agresividad. Los puntajes obtenidos fueron: (<a mayor clasificacion, mayor 
agresividad). 


PAREJAS: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

Grupo A: 

10 

8 

12 

16 

5 

9 

7 

11 

8 

16 

8 

5 

8 

6 

12 

14 

8 

4 

9 

Grupo B: 

10 

15 

10 

18 

13 

14 

9 

16 

6 

16 

6 

5 

5 

4 

11 

12 

8 

2 

8 


Utilizando la prueba del signo, al nivel del 5%, £se puede afirmar que la diferencia es significativa? 

96. Una empresa realiza un estudio para determinar el numero de unidades producidas por cada uno de 
los obreros, luego de ser sometidos a un curso de capacitacion, a fin de aumentar el rendimiento por 
obrero. 



Se pide: 

a) Aplicar la prueba del signo, para determinar si en realidad se mejoro el rendimiento (Nivel 5%) 

b) Aplicar la docima de normalidad (observaciones apareadas) al Nivel del 5%, para determinar si 
el curso ayudo a aumentar el rendimiento; en el punto, (b) fijar limites de confianza del 95%. 

97. Para evaluar la accion hipertensiva de una droga, se tomo la tension arterial a un grupo de individuos, 
antes y despues de su aplicacion; los resultados fueron: 


INDIVIDUOS: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

Antes: 

65 

65 

76 

84 

68 

70 

66 

82 

64 

65 

88 

82 

70 

70 

75 

80 

92 

Despues: 

72 

70 

78 

84 

74 

76 

72 

79 

65 

70 

88 

80 

76 

76 

75 

86 

80 


Utilice el nivel de signification del 5%, considerando que la muestra proviene de poblaciones de- 
pendientes y luego trabajela como perteneciente a una distribution no parametrica, que las diferen- 
cias no son significativas. 

98. Una prueba de ansiedad, fue aplicada a un grupo de 18 estudiantes universitarios varones estando 
sobrios y se repitio dos horas despues de que cada uno habia ingerido 100 cc de aguardiente. Los 
resultados del mdice de ansiedad fueron: 
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a) A1 nivel del 5% mediante, la prueba del signo, £se puede concluir que el alcohol tiene efectos 
sobre la ansiedad? 

b) A1 nivel del 5%, mediante la prueba “f ’ (observaciones apareadas), ^se podra concluir que el 
alcohol no reduce la ansiedad? 

99. Para probar los efectos de un curso de educacion fisica sobre la condicion corporal de los alumnos, 
se ha registrado el numero de “sentadillas” que una persona puede realizar en un minuto. Diecisiete 
participantes escogidos al azar, muestran las siguientes puntuaciones: 


PERSONAS: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

Antes : 

29 

22 

25 

29 

26 

24 

21 

20 

46 

38 

28 

30 

29 

25 

21 

22 

23 

Despues : 

30 

26 

25 

35 

33 

36 

32 

20 

54 

58 

43 

30 

30 

20 

20 

20 

23 


Con las anteriores observaciones apareadas, provenientes de poblaciones dependientes: 

a) Pruebe la hipotesis de que hubo mejoramiento, al nivel del 5%. 

b) Utilizando la prueba del signo, pruebe la hipotesis de que hubo mejoramiento, al nivel del 5%. 

100. Un quimico asegura que ha descubierto un aditivo para la gasolina, que aumenta el rendimiento 
del combustible. Para probar el rendimiento se ponen a prueba 18 autos con y sin aditivo. Los 
resultados en kilometros/ galon son: 


AUTOMOVIL: 

123456789 

Sin aditivo: 
Con aditivo: 

40,6 63,3 48,2 38,4 39,2 42,6 42,0 46,1 51,0 

51,2 62,1 52,3 42,0 43,5 40,5 42,0 50,2 51,0 


AUTOMOVIL: 

10 11 12 13 14 15 16 17 18 

Sin aditivo: 
Con aditivo: 

39,1 38,6 42,0 38,6 38,4 37,3 38,6 39,3 37,6 

42,6 40,4 42,4 37,5 39,6 40,2 41,2 38,4 40,2 


a) Considere que las muestras provienen de poblaciones dependientes. (Observaciones apareadas) 
Se pide establecer los limites de confianza del 95% y probar si la diferencia es significativa 
(Nivel del 5%). 

b) Considere que las muestras provienen de poblaciones no parametricas (Aplicando la prueba del 
signo) y determine si la diferencia es significativa (Nivel del 5%). 


101. En un esfuerzo por disminuir los costos de transporte, una empresa de taxis imparte clases de 
manejo economico a cada uno de sus 20 conductores. Ponga a prueba los resultados, utilizando un 
nivel de significacion de 0,05 en observaciones apareadas y en la prueba de signos. (Utilice los dos 
metodos de calculo). 



Nota : El rendimiento se tomo en kilometros / galon. 
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102. En un experimento apareado (no parametrico) se dan las velocidades (numero de elementos 
empaquetados por hora), aplicando dos sistemas diferentes con los siguientes resultados: 

Positivo =14 pares Negativo = 3 pares Cero = 3 pares 

l A1 nivel de 5% la diferencia es significativa? 


CORRELACION POR RANGOS 


Conocida tambien como Metodo de Spearman , algunos la denominan Prueba del coeficiente de corre- 
lacion de las categorlas, establecida y empleada por Pearson y Spearman desde 1936; esta medida nos 
determina la existencia del grado de asociacion entre dos variables, utilizando para ello una escala ordi¬ 
nal, de tal manera que se puedan colocar en dos series ordenadas. 


La formula a utilizar es: 


6 Xdj 
n -n 


(En el capitulo 12 sobre “Regresion y Correlacion” hay un complemento de este tema, que debe ser consultado). 


Ejemplo 1 . Supongamos que se tienen los siguientes 16 pares de observaciones, a 16 trabajadores que 
fueron evaluados con dos instrumentos. 


No.: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

x: 

85 

78 

75 

65 

80 

83 

76 

65 

83 

76 

83 

65 

90 

80 

84 

76 

y;- 

50 

38 

30 

25 

38 

42 

35 

25 

45 

35 

42 

25 

55 

40 

48 

35 


Primero : Ordenamos los datos de menor a mayor, o de menor a mayor, de esta manera establecemos 
los rangos: 


x.: 

l 

65 

65 

65 

75 

76 

76 

76 

78 

80 

80 

83 

83 

83 

84 

85 

90 

Rango : 

2 

2 

2 

4 

6 

6 

6 

8 

9,5 

9,5 

12 

12 

12 

14 

15 

16 

y r ' 

25 

25 

25 

30 

35 

35 

35 

38 

38 

40 

42 

42 

45 

48 

50 

55 

Rango: 

2 

2 

2 

4 

6 

6 

6 

8,5 

8,5 

10 

11,5 

11,5 

13 

14 

15 

16 


Segundo : Reemplazamos cada valor de X y Y en la tabla original (enunciado) por su respectivo 
rango, luego establecemos las diferencias entre cada rango y las elevamos al cuadrado. Finalmente 
sumamos la columna d 2 = 357 

i 


Rango x .: 

2 

9,5 

6 

4 

9,5 

8 12 

14 

15 

16 

2 

12 

6 

6 

12 

2 

Rango y .: 

4 

2 

6 

10 

8,5 

11,5 14 

15 

16 

13 

2 

6 

8,5 

6 

2 

11,5 

d .: 

i 

-2 

7,5 

0 

-6 

1 

-3,5 -2 

-1 

-1 

3 

0 

6 

-2,5 

0 

10 

-9,5 

d 2 : 

l 

4 

56,25 

0 

36 

1 

12,25 4 

1 

1 

9 

0 

36 

6,25 

0 

100 

90,25 



= !- 

6 ( 57) 

16 -16 

= 

II 

<N O 

00 

^ °, 

<N 

1 

H 

1- 

0,525 = 

0, 

75 






PRUEBA DET 

s 

Cuando n es grande in > 25) se considera que r tiene el comportamiento de una distribucion aproxima- 
damente Normal con Media 0 y Desviacion tipica j-, P or tal razon calculamos Z, siendo: 
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Ejemplo 2. Suponiendo que n = 28 r = 0,48, al nivel del 5% probar que el coeficiente de correlacion 
es significativo. 

Solution: Z = = r -Jn-1 = V —T = 

l/Vw-l 

1) // () : 7? = 0 (wo es significativo, no hay correlacion ) 

// : Rfi 0 (es significativo, hay correlacion ) 

2) oc = 0,05 

Al nivel del 5%, el coeficiente de correlacion es 
significativo. Se puede concluir que estas dos 
variables estan asociadas en la poblacion de donde se 
selecciono la muestra. 

Cuando n es pequeha (10 < fl < 25) o bien si el valor de es pequeno, es aconsejable utilizar la 
distribucion “f ’ de Student, donde: 




- 1,96 


1,96 


Si consideramos el ejercicio donde, n 


t = 


0, 75 


7(1-0, 75 2 ) / (16- 2) 


= 2,02 


16 y r s = 0,475, se observa que: 

, , o, 75716^2 om 

o t= , - =2,02 

Vd-0, 75 2 ) 


!) 77 0 := 0 u=w-2=l 

H a :R s * 0 oc = 0,05 

2)oc = 0,05 ? o, 05 =2,1 5 

Al nivel del 5%, se concluye que no hay correlacion, es 
decir, que la correlacion obtenida no es significativa. 
Tambien se puede decir que estas dos variables no 
estan asociadas en la poblacion de donde se extrajo 
la muestra. 


H n :p. s =0 
H x 0 


n 



En muestras pequehas , se puede utilizar la TAB LA XVII, donde aparecen los valores teoricos para 
r, veamos su uso: 


1) H 0 :R,=0 r 

H a -R^ 0 I 

2) oc = 0,05 

r v = calculado =0, 


H n : Ps=0 

75 


n 


J 


/I = 16 



- 0,507 0,507 
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Observamos que r = 0,475 cae en la zona de aceptacion, es decir, aceptamos H Q , donde R s = 0, im- 
plica que no hay correlacion. Se puede decir, que al nivel de 5%, estas dos variables no estan asociadas, 
resultado igual al obtenido cuando aplicamos la TAB LA II, correspondiente a la “t” de Student. 

Para muestras pequenas (n < 30) la distribucion r no es normal; muchos autores utilizan la “t” 
de Student, tal como se hizo en el ejercicio anterior, sin embargo, no son pocos quienes sostienen que 
este proceso o metodo no es tan apropiado, por el contrario prefieren utilizar la Tabla XVII (al final del 
libro), correspondiente a los Coeficientes de Spearman , como el utilizado anteriormente para muestras 
pequenas. 

LA PRUEBA T DE WILCOXON 


Denominada por algunos como Prueba del signo de las categorlas , ya que no solo establece las dife- 
rencias para cada par de observaciones, sino que las clasifica, aspecto este que se tiene en cuenta en la 
prueba del signo, por tal razon se le considera de mayor eficacia entre las pruebas no parametricas. Esta 
prueba fue establecida por Frank Wilcoxon en el ano de 1945. 


MUESTRAS PEQUENAS 

Veamos primero el procedimiento que se sigue en muestras pequenas para pares igualados. 


□ Se obtienen las diferencias para cada par de observaciones, d. = x. -y. 

□ Luego establecemos categorlas, ordenando sus diferencias de acuerdo con sus 
magnitudes en valor absoluto, es decir, no tomamos en consideracion el signo. 

□ Procedemos a determinar el valor de T, para ello seleccionamos la suma mas pequena 
para uno de los signos. 

□ Determinamos el valor de n, con el fin de conocer el tamano. Si n < 25 utilizamos la 
tabla XVIII (al final del libro), pero si n > 25, se puede admitir que la suma de los 
rangos tiene una Distribucion normal , por lo tanto se debe utilizar la tabla Z. 


Nota: Vale la pena anotar que algunos autores consideran una muestra pequena cuando n <50 y 
grande cuando n > 50. 

Ejemplo 1. Para explicar el procedimiento e interpretacion de los resultados obtenidos, partamos del 
supuesto de una muestra realizada a 12 parejas, para estimar su actitud frente al manejo de sus hijos en 
los problemas escolares, (un menor puntaje corresponde a una actitud menos favorable): 



</,Al nivel del 5% existe una misma actitud, en las parejas, frente a los problemas escolares? 
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Solution: 


PAREJA 

ESPOSA 

ESPOSO 


d. 

i 

RANGO 

d. 

SIGNO 

MENOS 

FRECUENTE 


No. 

d i 

ORDENADO 

RANGO 

1 

35 

29 


6 

6,5 



1 

1 

1 

2 

46 

32 


14 

11,0 



2 

2 

2,5 

3 

29 

36 


-7 

-8,0 

-8 


3 

2 

2,5 

4 

32 

35 


-3 

-4,0 

-4,0 


4 

3 

4 

5 

40 

46 


-6 

-6,5 

-6,5 


5 

4 

5 

6 

43 

45 


-2 

-2,5 

-2,5 


6 

6 

6,5 

7 

36 

35 


1 

1,0 



7 

6 

6,5 

8 

30 

18 


12 

10,0 



8 

7 

8 

9 

56 

41 


15 

12,0 



9 

8 

9 

10 

35 

37 


-2 

-2,5 

-2,5 


10 

12 

10 

11 

48 

40 


8 

9 



11 

14 

11 

12 

29 

25 


4 

5 



12 

15 

12 

- 

- 

- 


- 

- 

T = 23,5 


- 

- 

- 


1) H 0 : la actitud de las parejas, no difiere 
H fl : la actitud de las parejas, difiere 

2) oc = 0,05 T 005 = 14 (vertablaal final del libro) Observamos que T > T Q05 (21 > 14) 


Con una T Q05 =14 quiere decir que aceptamos a H , al nivel del 5%. Concluyendo que la actitud de 
los padres frente al problema escolar no difiere. 

Si se hubiese presentado el caso en que T < T Q 05 estariamos rechazando a H Q , al nivel del 5%, conclu¬ 
yendo que la actitud de los padres, frente al problema escolar de sus hijos difiere en forma significativa. 

Ejemplo 2. Se disena un estudio de tiempos y movimientos, con el fin docimar la eficiencia de dos 
procedimientos para montar cierto mecanismo. Se aparean los obreros con base en los coeficientes de 
inteligencia y el numero de anos de educacion. Los miembros de cada par son asignados en grupos a uno 
de los dos procedimientos. El tiempo en segundos para terminar el montaje es como sigue: 



Solution: 


EXPERIMENTO 

PROCEDIMIENTOS 

d. 

i 


CATEGORIAd. 

i 


No. 

ORDEN 

RANGO 

I 

II 

+ 

- 

1 

44 

41 

3 


3 



1 

2 

1,5 

2 

40 

44 

-A 



-6,5 


2 

2 

1,5 

3 

40 

29 

11 


11 



3 

3 

3 

4 

31 

27 

4 


6,5 



4 

4 

6,5 

5 

44 

30 

14 


12 



5 

4 

6,5 

6 

41 

41 

0 


- 

- 


6 

4 

6,5 
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Continuation 


7 

26 

28 

-2 

8 

26 

30 

-4 

9 

32 

34 

-2 

10 

38 

23 

15 

11 

37 

29 

8 

12 

29 

25 

4 

13 

20 

20 

0 

14 

40 

36 

4 

15 

31 

27 

4 

16 

44 

44 

0 



-1,5 


7 

4 

6,5 


-6,5 


8 

4 

6,5 


-1,5 


9 

4 

6,5 

13 



10 

8 

10 

10 



11 

11 

11 

6,5 



12 

14 

12 

- 

- 


13 

15 

13 

6,5 

6,5 



Nota: Eliminamos 
las diferencias 

75,0 

16,0 


iguales a cero 


Observemos en las tablas anteriores la mas pequena, en la cual aparece cl., ordenada de menor a 
mayor, sin tener en cuenta los signos. La columna RANGO se calculo teniendo en cuenta la columna 
No., asi aparece dos veces el 2, por lo tanto el rango sera: 1,5= ^-^ = — ; luego el 3 (una sola vez), su 
rango corresponde al numero 3; el 4 aparece 6 veces, por lo tanto su rango es -^^ = — : = 6,5 ; el 10 sera 
10 y asi sucesivamente. 

Sabemos que la prueba es bilateral, que n= 13 a= 0,05 y T =16 por ser la suma de los valores 
negativos, siendo la mas pequena de las dos columnas. 

En la Tabla No. XVIII encontramos que el valor teorico es de T Q05 =17. 

Si T < T Q05 rechazamos => H Q : la diferencia no es significativa; no difiere 
Si T > T Q05 aceptamos => H a : difiere; la diferencia es significativa 

En el ejercicio que estamos desarrollando encontramos que 16 < 17; es decir que T< T Q05 por lo 
tanto aceptamos H a : la diferencia es significativa , es decir que difiere la eficiencia en los dos procesos. 
Si nos devolvemos a observar la prueba del signo, el resultado es al contrario, es decir, que no existe una 
diferencia significativa (se acepta H 0 ) entre los dos procesos, al nivel del 5%. 

MUESTRA GRANDE 

En este caso, utilizamos el ejercicio No. 91 que aparece en la pagina 457, cuando se trabaja con muestras 
grandes (Yl > 25) 

Ejemplo 3. Los datos que se dan a continuacion corresponden al numero de piezas defectuosas 
producidas por dos maquinas durante el mes de septiembre de 2011. Probar al nivel del 5%, que no hay 
una diferencia significativa entre los dos procesos. 
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NUMEROS DEFECTUOSOS 

Dias 

A 

B 

d t =x f -y t 

1 

8 

9 

-1 

2 

5 

4 

1 

3 

10 

12 

-2 

4 

7 

9 

-2 

. 5 

9 

10 

-1 

6 

11 

11 

0 

7 

3 

6 

-3 

8 

6 

7 

-1 

9 

6 

8 

-2 

10 

8 

10 

-2 

11 

5 

6 

-1 

12 

6 

9 

-3 

13 

9 

11 

-2 

14 

3 

6 

-3 

15 

7 

7 

0 

16 

10 

8 

2 

17 

9 

12 

-3 

18 

13 

13 

0 

19 

8 

9 

-1 

20 

4 

6 

-2 

21 

2 

3 

-1 

22 

8 

9 

-1 

23 

8 

10 

-2 

24 

6 

9 

-3 

25 

5 

7 

-2 

26 

10 

11 

-1 

27 

9 

9 

0 

28 

4 

6 

-2 

29 

7 

6 

1 

30 

3 

5 

-2 


RANGOS 


5,5 


16,0 


5,5 


-5,5 

-16,0 

-16,0 

5,5 

-24,0 

-5,5 

-16,0 

-16,0 

-5,5 

-24,0 

-24,0 


-24,0 

-5,5 

-16,0 

-5,5 

-5,5 

-16,0 

-24,0 

-16,0 

-5,5 

-16,0 

-16,0 


T = 27 


ORDEN 

No. 

di 

Rango 

1 

1 

5,5 

2 

1 

5,5 

3 

1 

5,5 

4 

1 

5,5 

5 

1 

5,5 

6 

1 

5,5 

7 

1 

5,5 

8 

1 

5,5 

9 

1 

5,5 

10 

1 

5,5 

11 

2 

16 

12 

2 

16 

13 

2 

16 

14 

2 

16 

15 

2 

16 

16 

2 

16 

17 

2 

16 

18 

2 

16 

19 

2 

16 

20 

2 

16 

21 

2 

16 

22 

3 

24 

23 

3 

24 

24 

3 

24 

25 

3 

24 

26 

3 

24 

Nota: Elminamos las 
diferencias iguales a 
cero, siendo n = 26 


Observemos que el valor de T= 27. Ademas, como Tl > 25, la distribucion muestral de T es aproxi- 
madamente normal (recordemos que algunos la consideran asi cuando n > 50), procedemos a calcular la 
media y la varianza de T 7 , cuando Tl = 26, de la siguiente manera: 

M[T] = f = ^±^ = ^)=175,5 


(2h + 1)M[ t j n(n + l)(2n + l) 

F W = -6- = -2- 


Reemplazando, se tendra el mismo resultado 


„ c2 (52 + 1) (175,5) 26(27) (52 + 1) , CCA oc 

V\ [ T ] = 5[ T ] = -g-=-2- = 1 550 ’ 25 

s [t] = = yjl 550,25 = 9,17 
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En consecuencia la variante estadistica Z, esta dada por la siguiente formula: 
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y_ r ~ M [r] _ 27-175,5 


I r] 


8,62 


,85 


Es necesario observar que T = 27, la categorizacion la hacemos con valor absoluto, procediendo 
a elegir la suma mas pequena, sin tener en cuenta el signo, en este caso corresponde a la columna con 
signos positivos. 

1) H 0 : la diferencia no es significativa 
H 0 : la diferencia es significativa 

2) a = 0,05 

3) Z = -3,85 cae dentro de la region critica, es decir, w ^^^ ? 

rechazamos H Q y aceptamos H a , la diferencia entre los i 6 i 6 

dos procesos se considera significativa, al nivel del 5%, 

con un resultado igual al obtenido cuando aplicamos la Prueba del signo (ver pagina 451). 



PRUEBA U DE MANN-WHITNEY 


Es la prueba mas aplicada, dentro de las distribuciones no parametricas , debido a que toma la mayor in- 
formacion que poseen los datos, haciendola mucho mas eficiente que las otras pruebas, sobretodo cuando 
se seleccionan dos conjuntos aleatorios e independientes , en tal forma que se puedan ordenar por rangos. 
Tiene un proceso de calculo muy parecido al utilizado en la Prueba del signo , siendo usada para probar 
si dos grupos muestrales proceden de una misma poblacion. 

El proceso de calculo se hace engorroso, cuando los tamanos muestrales n x y n 2 son grandes, pues 
se trabaja con dos grupos independientes. 

MUESTRAS GRANDES 

El calculo o desarrollo de esta prueba, requiere de los siguientes pasos: 

□ Se ordenan todos los datos, como si fuera una sola muestra, de menor a mayor. 

□ Se establece el rango, es decir, se categoriza. 

□ Se coloca el valor del rango al frente de cada observation, manteniendo la presentacion 
original dada para las dos muestras. 

□ Se suma la columna del rango en forma independiente para cada muestra, obteniendose R { 
y R 2 respectivamente. 

□ Se aplica la formula correspondiente a la prueba U, siendo: 

(2 )U=n 1 n 2 + ^ (w j +1) -* 2 


La mayorfa de los investigadores aplican la Prueba U, cuando n x o n 2 es mayor a 20, admitiendo de 
esta manera que la distribucion tiene un comportamiento similar a la normal , siendo utilizada en estos 
casos la variante estadlstica Z, igual a: 
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ry _ u - ( n x - n 2 / 2) 

i 

n x n 2 (n l + n 2 + 1) 

12 


Ejemplo: 1 . Supongamos dos muestras grandes e independientes ( n l =23 y n 2 =12) correspondientes a 
dos pruebas cuyas puntuaciones fueron las siguientes: 



CATEGORIZACION 

PRIMERA 

PRUEBA jt 

SEGUNDA 
PRUEBA y 

RANGO 

X. 

l 

RANGO 

y t 

No. 

Orden 

Rango 

No. 

Orden 

Rango 

10 

5 

21,5 

5,0 

1 

4 

2 

19 

9 

19,0 

4 

13 

2,0 

28,0 

2 

4 

2 

20 

10 

21,5 

9 

13 

19,0 

28,0 

3 

4 

2 

21 

10 

21,5 

10 

8 

21,5 

16,5 

4 

5 

4 

22 

10 

21,5 

11 

10 

24,0 

21,5 

5 

5 

5 

23 

10 

21,5 

14 

12 

31,0 

25,5 

6 

6 

8,5 

24 

11 

24,0 

13 

16 

28,0 

34,0 

7 

6 

8,5 

25 

12 

25,5 

4 

15 

2,0 

33,0 

8 

6 

8,5 

26 

12 

25,5 

6 

8 

8,5 

16,5 

9 

6 

8,5 

27 

13 

28,0 

5 

6 

5,0 

8,5 

10 

6 

8,5 

28 

13 

28,0 

6 

14 

8,5 

31,0 

11 

6 

8,5 

29 

13 

28,0 

7 

18 

13,0 

35,0 

12 

7 

13,0 

30 

14 

31,0 

6 

n= 12 

8,5 

1^2=282,5 

13 

7 

13,0 

31 

14 

31,0 

7 


13 


14 

7 

13,0 

32 

14 

31,0 

8 


16,5 


15 

8 

16,5 

33 

15 

33,0 

14 


31,0 


16 

8 

16,5 

34 

16 

34,0 

6 


8,5 


17 

8 

16,5 

35 

18 

35,0 

4 


2,0 


18 

8 

16,5 




8 


16,5 








6 


8,5 








12 


25,5 








10 


21,5 








7 


13,0 









n= 23 = 8 


Como 


ZR 2 <ZR { 


( 282,5 <348) operamos con la segunda formula de U asi: 


U- 


n 2 (n 2 +1) 

ru n 0 + 2 2 - -~R 


Reemplazando se tiene: 


U= 1 + -— - = 6+ - =1 

1) H 0 \ Todas las observaciones provienen de la misma poblacion. 
H ff : Provienen de poblaciones diferentes. 

2) oc = 0,05 

3) U = 71,5 
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A1 nivel del 5% estas observaciones 
no provienen de una misma poblacion. 


“ = 0 , 025 / 


Nw “ = 0,025 

RC 

I 

7A 

RC 

1 7 

1 

-1,96 


\ L 

1,96 


MUESTRAS PEQUENAS 


Cuando las dos muestras (Tl x y n 2 ) son menores de 8, (muy pequenas), no se debe aplicar el metodo 
para muestras pequenas que se explica a continuacion, siendo necesario utilizar procedimientos y tablas 
diferentes a las anteriores. 


Ahora, si una de las dos muestras tiene un tamano mayor o igual a 9, se procede de la siguiente forma: 


□ 

□ 

□ 

□ 

□ 

□ 

□ 

□ 


Ordenamos todos los datos, de menor a mayor, sin tener en cuenta a que muestra pertenecen. 


Se ordenan por rangos todas las observaciones, como se ha venido haciendo en las pruebas 
anteriores; por ejemplo 7 y 7, ocupan la posicion 5 y 6 respectivamente, por lo tanto el 
rango sera de 5,5. 


Se obtienen dos columnas para los rangos R x y R 2 

Se procede a la suma de cada columna de los rangos, con el fin de obtener las HR X y HR 2 
La suma de las dos columnas de rangos debe ser igual a: HR X + HR 2 = n ^ 

La medida U que se debe aplicar puede ser: 


U- 


n x (n x +1) 


-K 


U- 


n 2 (n 2 + 1) 


*2 


Siempre se toma la formula que tenga la HR mas pequena. 

Finalmente utilizamos la Tabla XIV, localizando en ella a Tl x y lfl 2 , para un determinado 
nivel de significacion, teniendo en cuenta si la prueba es unilateral o bilateral. 


Ejemplo: 2. Consideremos dos muestras pequenas, donde n 2 = 8 y n 2 = 11, para observar la aplicacion 
de la prueba U de Mann - Whitney, para muestras pequenas, a fin de probar que ambas proceden de la 
misma poblacion, al nivel del 5%. 

Solution: 


No. 

PRUEBAS 

RANGO 

I 

RANGO 

n 

CATEGORIZACION 

I 

I 

No. 

Orden 

Rango 

No. 

Orden 

Rango 

1 

18 

28 

7,5 

15,0 

1 

13 

1,0 

11 

23 

11,5 

2 

24 

32 

13,0 

18,0 

2 

14 

2,0 

12 

23 

11,5 

3 

22 

28 

9,5 

15,0 

3 

16 

3,5 

13 

24 

13,0 

4 

23 

32 

11,5 

18,0 

4 

16 

3,5 

14 

28 

15,0 

5 

17 

16 

5,5 

3,5 

5 

17 

5,5 

15 

28 

15,0 

6 

16 

18 

3,5 

7,5 

6 

17 

5,5 

16 

28 

15,0 


Continua... 
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Continuation 


7 

14 

17 

2,0 

5,5 

7 

18 

7,5 

17 

32 

18,0 

8 

20 

13 

9,5 

1,0 

8 

18 

7,5 

18 

32 

18,0 

9 


23 


11,5 

9 

22 

9,5 

19 

32 

18,0 

10 


28 


15,0 

10 

22 

9,5 




11 


32 


18,0 








nj= 8 

n= 11 

X/?! = 62 

Zfl 2 = l 2 








Elegimos la sumatoria mas pequena, en este caso es 'ZR X = 62, que nos permite calcular el valor de 
U, tal como se desarrolla a continuacion: 

U = n l n 2 + - ( ^ +1) -Ri «= 88 + 6-62 = 62 

Observemos, que al utilizar la formula para R 2 , el resultado es diferente, siendo: 

TT n n +1 _ 

U - n x n +- R — + 66 — 1 — 

Calculadas las dos U, una para cada R, se elige la menor, en nuestro caso sera U = 22 

Utilicemos la Tabla XIV, localizando los valores para n x = 8 y n 2 =11, con un nivel de a = 0,05 
para una prueba bilateral , obteniendo los valores criticos de U=19. El valor sera significativo cuando el 
resultado aplicando la formula U, sea menor o igual al valor obtenido en la Tabla, en caso contrario no 
sera significativo, como en este caso donde 22>19, por lo tanto, se acepta la hipotesis nula H q , es decir, 
aceptamos que estas dos muestras provienen de una misma poblacion, al nivel del 5%. 

MUESTRAS MUY PEQUENAS 

Hasta el momento, en cuanto se refiere a la Prueba U de Mann - Whitney, hemos visto dos casos: 


□ Cuando una de las n x y n 2 son mayores de 20, se consideran como muestras grandes y se 
aplica la prueba de normalidad Z. 

□ Cuando una de las n x y n 2 es igual o mayor que 9, consideradas como muestras pequenas, 
utilizamos la Tabla XIV. 


Ahora se tiene un tercer caso, cuando ninguna de las n x y n 2 son mayores a 8, consideradas a la vez 
como muestras muy pequenas, para ello se utiliza la Tabla XIII y el procedimiento a seguir se explica 
mediante el desarrollo de un ejercicio tornado como modelo. 

Ejemplo 3. Supongamos la realizacion de dos experimentos, para los cuales se obtuvieron 4 y 5 controles, 
respectivamente con los siguientes resultados o puntajes. 


Puntaje A: 

8 

9 

11 

16 


Puntaje B: 

7 

10 

12 

6 

13 


Clasificamos los puntajes de menor a mayor, identificandolos de acuerdo a su respectiva muestra, 
Ay B. 
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6 

7 

8 

9 

10 

1 1 

12 

13 

16 

B 

B 

A 

A 

B 

A 

B 

B 

A 


Ahora, contamos el numero de veces que A precede a B. Observemos que la primera A corres- 
pondiente a la calificacion 8, precede o antecede a tres veces B, (calificaciones 10, 12 y 13), luego la 
segunda A (calificacion 9) precede tambien a las tres de las calificaciones (10, 12y 13 ); y la tercera 
A (calificacion 11) precede a dos B (calificaciones 12 y 13) y la ultima A no precede a ninguna califi¬ 
cacion es decir 0. 

De acuerdo a lo anterior se tiene que U = 3+3+2+0=8. Veamos que sucede, si hubieramos hecho lo 
contrario, donde B precede a A, habrfamos encontrado la siguiente situacion: 

U’ = 4+4+2+2+1+1 = 14, a esta suma, para diferenciarla de la anterior la simbolizamos por U\ 
Segun la hipotesis nula planteada UyU’ deben ser iguales, en caso contrario, de presentar una dife- 
rencia, procedemos a establecer si ella es significativa, al nivel de significacion que se este probando o 
docimando. 

La hipotesis nula H 0 y la alternativa H a se plantean de la siguiente manera: 

H Q : Las distribuciones de frecuencias relativas de las poblaciones A y B son identicas. 

H a : (Prueba Bilateral): La distribucion de frecuencias relativas de una poblacion esta desplazada 
con relation a la distribucion de la otra poblacion. 

H a : (Prueba Unilateral): La distribucion de frecuencias relativas de la poblacion A esta desplazada 
a la derecha de la distribucion de frecuencias de la poblacion B. 

Procedemos a consultar la Tabla XIII que consta de 6 subtotales separados, una por cada valor co- 
rrespondiente a U 2 , que va desde n 2 =3 hasta n 2 =8, dado que siempre representara el grupo que tenga 
el menor numero de observaciones, en este caso sera n } = 4. 

En el ejemplo conocemos: = 5, n 1 = 4 y U = 8, con lo cual consultamos en la Tabla (ver el tercer 
cuadro de la Tabla XIII), siendo el valor de p = 0,365 valor sombreado, es decir, correspondiente a la 
probabilidad de que U sea menor o igual a 8 cuando la prueba es unilateral ; si la prueba es bilateral , se 
tomarfa el doble de lo aparecido en la tabla, siendo el valor dtp = 0,730. 

PRUEBA H DE KRUSKAL Y WALLIS 


En los capftulos correspondientes a distribuciones parametricas consideramos el analisis de varianza 
(ver paginas 412 al 414), utilizada para probar si las medias poblacionales eran iguales bajo el supuesto 
de normalidad, con desviaciones estandar iguales para esas poblaciones. 

El anterior procedimiento no es valido, ni recomendable, cuando se trata de distribuciones no pa¬ 
rametricas. Para estos casos, en el ano 1952 W.H. Kruskal y W.A. Wallis , elaboraron una prueba que 
permite trabajar con rangos, sin exigencia en cuanto a los parametros de la poblacion. Actualmente se 
conoce como Prueba de Kruskal - Wallis , prueba H 6 Analisis de Varianza por Rangos. 


El procedimiento a seguir para el calculo del valor para H, debe: 
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□ Ser requisito indispensable que las poblaciones sean independientes. 

□ Combinar todos los valores de las muestras, como si fuera una sola. 

□ Ordenar de menor a mayor, es decir, categorizamos. 

□ Establecer los rangos, tal como se ha venido haciendo en las pruebas anteriores. 

□ Sumar los rangos para cada muestra. 

□ Aplicar la siguiente formula, para el calculo de H: 

H= 1 —^-1——— + - n +1 

n n +1 n x n 


Es necesario que cada muestra tenga por lo menos 5 observaciones (es decir, que cada tamano 
muestral sea mayor o igual a 5), de esta manera su distribucion sera muy cercana a la de Chi cuadrado , 
con K - 1 grados de libertad, donde K corresponded al numero de muestras tomadas para la prueba. 

Ejemplo 1 . Supongamos que el Presidente de una Corporacion Financiera, esta interesado en estudiar 
la rapidez de operacion que se presenta, desde el momento en que se deposita y se retira el dinero de las 
cuentas. Para ello elabora un indice de permanencia del dinero, estableciendo un indice del 350 para una 
cuenta considerada extremadamente activa en el semestre; pero si solo se hacen 10 retiros, en el mismo 
periodo, el indice es de 80. De acuerdo a la anterior escala (de 80 a 350), los indices obtenidos en cuatro 
(4) muestras, en igual numero de sucursales, fueron: 


SUCURSAL 

INDICES 

Caracas 

120 

116 

80 

206 

305 

206 

180 

150 

Chapinero 

206 

180 

300 

180 

305 




Centro 

100 

80 

206 

305 

310 

300 



Niza 

206 

150 

210 

206 

310 

120 

116 

120 340 


Utilizando un nivel de 5%, aplicar la prueba de Kruskal - Wallis, a fin de probar si hay una diferen- 
cia significativa en cuanto a los indices de movimiento de cuentas de ahorros personales, entre las cuatro 
(4) sucursales de esta corporacion financiera. 

Solution: 


Lo primero que hacemos, es categorizar las observaciones como si fuera una sola muestra, 
obteniendose el rango para cada uno de ellos, asi: 




En segundo lugar, procedemos en cada muestra a colocar el rango a cada una de las observaciones, 
de esta manera se puede establecer la sumatoria de los rangos, en la respectiva muestra. 
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CARACAS 

CHAPINERO 

CENTRO 

NIZA 

Indice 

Rango 

Indice 

Rango 

Indice 

Rango 

Indice 

Rango 

120 

7,0 

6 

1 

100 

,0 

206 

17,5 

116 

,5 

1 

1 

80 

1,5 

150 

8,5 

80 

1,5 


1 

206 

17,5 

180 

12,5 

206 

17,5 

1 

1 

05 

2 ,0 

206 

17,5 

05 

2 ,0 



10 

26,5 

10 

26,5 

206 

17,5 

ZR = 

00 

21,5 

120 

7,0 

180 

12,5 


n = 


ZR =9 

116 

,5 

150 

9,5 




n =6 

120 

7,0 


IT?, = 9 ,0 




0 

28,0 


n l = 8 






ZR =1 0 








n -9 


Reemplazamos los anteriores resultados, en la formula para calcular el valor de H , siendo: 


n — n^-\- n^^ n + n —8 + 5 + 6 + 9 — 28 


H _ 12 
28(28 + 1) 


(9 ,0) 2 (88,0) 2 (9 ,0) 2 (1 0,0) 2 

8 + 5 6 9 


(28 + 1) 


H = 0,01 778 [l 10 ,5 + 1 5 8,8 + 1 72,67 + 1 877,78]-87 
H = 0,01 778 [6 00 ,75]-87 =88,7 -87 = 1,7 


Determinamos los grados de libertad: 

U= K— 1 = 4 - 1 = 3. Recordemos que K corresponde al 
numero de muestras, en este caso son 4. 

Si el nivel de significacion es a = 0,05, se tendra en la 
Tabla para Chi Cuadrado (% 2 ) un valor igual a 7,815. 



La regia de decision consiste en aceptar Ho, cuando H < % 2 0 05 , tal como sucede en este caso donde 
1,73 <7,815. 


H Q : No hay una diferencia significativa en cuanto a los indices de movimiento de cuentas de ahorro, 
entre las cuatro sucursales, al nivel del 5%. 

H a : Cuya conclusion seria, cuando H > % 2 005 las distribuciones de indicadores no son iguales, 
equivale a aceptar que existen diferencias significativas en cuanto a las puntuaciones. 


EJERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


103. Consideremos que el ICFES realiza pruebas para el ingreso a la Universidad donde el puntaje maximo 
que puede obtener un egresado del bachillerato, es de 400 puntos. Una universidad dentro de sus 
aspirantes selecciona una muestra de 8 hombres y otra de 14 mujeres, con el fin de probar si existe 
una diferencia en su preparacion de acuerdo al sexo. Probar el nivel del 5% que no hay diferencia. 
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HOMBRES: 

310 

280 

320 

180 

260 

280 

310 

280 

MUJERES: 

180 

280 

260 

340 

370 

320 

280 

250 240 310 260 340 300 240 


104. En una fabrica se establecen dos procedimientos de entrenamiento para sus trabajadores. Se midio 
el tiempo (minutos) necesario para la realizacion de cierta operacion, con los siguientes resultados: 


PROCEDIMIENTO 

A: 

18 

25 

10 

14 

17 

22 

16 

PROCEDIMIENTO 

B: 

10 

27 

18 

18 

20 

10 

17 20 22 17 


Pruebe que los dos procedimientos son igualmente efectivos, al nivel del 5%, utilizando la prueba 
de Mann-Whitney. 

105. En una granja avicola, el administrador encuentra que en el mercado se ofrecen cuatro (4) productos 
que permiten alimentar sus animales, todos ellos de excelentes resultados en el aumento de peso (en 
onzas), utilizado durante un periodo determinado. 


Alimento A: 

12,8 

13,4 

16,0 

14,2 

12,8 



Alimento B: 

16,1 

14,2 

13,0 

13,4 

12,8 

16,0 

12,6 

Alimento C: 


14,3 

14,2 

12,8 

16,3 

16,0 

17,3 

Alimento D: 


10,8 

11,6 

14,2 

13,0 

12,8 



Probar al nivel del 5%, utilizando la prueba H de Kruskal-Wallis, si los pesos promedios son iguales 
para los animales, sin importar la clase de alimento. 

106. Mediante la aplicacion de una escala de 0 a 30, en dos muestras de 18 trabajadores cada una, 
establecer el rendimiento en dos procesos de fabricacion, con los siguientes resultados. 


ProcesoA: 

Proceso B: 

16,3 16,1 18,3 19,2 18,7 18,9 16,1 18,7 17,6 19,5 16,1 19,2 18,3 

16,3 19,1 14,8 18,2 18,6 16,6 19,2 18,2 17,5 18,9 18,6 18,2 17,8 


ProcesoA: 

Proceso B: 

16,3 16,1 18,3 19,2 18,7 18,9 16,1 18,7 17,6 19,5 16,1 19,2 18,3 

16,3 19,1 14,8 18,2 18,6 16,6 19,2 18,2 17,5 18,9 18,6 18,2 17,8 


Existe evidencia, al nivel del 10%, que nos indique alguna diferencia entre las dos poblaciones, al 
ser sometidas a diferentes procesos. (a) Utilice la prueba U; (b) Considere que es aplicable la prueba 
del signo (c) Realice la prueba de rangos T de Wilcoxon, bajo el supuesto de que sea la prueba mas 
indicada. 


107. Con el fin de aumentar la productividad de la empresa, un industrial desea cambiar el metodo de 
entrenamiento con el que ha venido capacitando a sus trabajadores. Selecciono una muestra de 
20 trabajadores, determino el numero de unidades producidas con el metodo anterior y luego, un 
tiempo despues, con el nuevo metodo, cuyos resultados se presentan a continuacion: 


TRABAJADOR: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

Metodo A: 

36 

28 

20 

26 

24 

25 

27 

20 

26 

20 

24 

30 

24 

Metodo B: 

40 

30 

20 

24 

20 

30 

27 

20 

28 

25 

24 

24 

28 


TRABAJADOR: 

14 

15 

16 

17 

18 

19 

20 

Metodo A: 

20 

28 

26 

30 

20 

26 

28 

Metodo B: 

19 

30 

30 

30 

24 

24 

24 


473 


Utilice primero la Prueba del signo y luego la Prueba de Wilcoxon, al nivel del 5%, a fin de demos- 
trar que el nuevo metodo de entrenamiento arrojo mejores resultados que el metodo tradicional. 
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108. El hospital San Juan de Dios de la ciudad, tiene por costumbre contratar personal auxiliar de 
enfermeria, unicamente en dos centros de formacion de los que existen en el pais, para ello prepara 
un formulario de evaluacion para ser aplicado a sus aspirantes, a fin de examinar el grado de 
formacion o conocimiento, aplicando una escala de 0 a 10, con la cual se obtuvieron los siguientes 
resultados: 


CENTRO A: 

86 

94 

65 

72 

83 

94 

90 

72 

62 

CENTRO B: 

62 

46 

42 

83 

75 

92 

94 

94 

72 86 62 


l A1 nivel del 5%, utilizando la prueba de U de Mann-Whitney, se podra concluir que los dos centros 
ofrecen la misma calidad academica? 

109. Varios accidentes automovilisticos menores ocurrieron en cruces de alto riesgo en la ciudad, a pesar 
de contar con semaforos. El departamento de transito dispuso la ubicacion de agentes de transito, 
ademas de los semaforos, a fin de reducir los accidentes. Se eligieron al azar 14 cruces, y el numero 
de accidentes durante el mes antes y despues de la modificacion fueron los siguientes: 



^Las modificaciones redujeron el numero de accidentes en los cruces de alto riesgo? (nivel 5%0). 

a. Resolverlo mediante la aplicacion de la Prueba del signo. 

b. Suponiendo que debe ser resuelto, aplicando la " t" de Student en observaciones apareadas 
(poblaciones dependientes). 

110. Un analista financiero desea saber si ha habido o no un cambio significativo en las utilidades por 
accion de un periodo a otro entre las empresas mas grandes del pais. Una muestra de 12 empresas 
seleccionadas entre 150 arrojo los siguientes resultados: 



Utilizando un nivel de significacion del 5%, ^Se puede afirmar que se ha presentado un cambio 
positivo en cuanto a las utilidades por accion entre los dos periodos? 

111. Dentro de las informaciones que se dan sobre la preferencia por marcas de los automoviles para taxi 
que mas se venden en el pais, se dice que el 36% por Renault, 30% por Mazda, 20% por Chevrolet, 
12% por Hyundai y 2% otras marcas. Una muestra reciente sobre las ventas de automoviles para taxi, 
revelo que 250 fueron Renault, 186 Mazda, 124 Chevrolet, 50 Hyundai y 6 otras marcas. Probar al 
nivel del 5% la hipotesis de que no ha habido cambio en las preferencias de compra segun la marca. 

112. ^La prueba del signo corresponde a una distribucion no parametrica, sus observaciones se aparean 
y es apropiada para experimentos «antes y despues»? 

113. /,Cual es la finalidad cuando se realiza la prueba al coeficiente de correlacion? 
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114. Un funcionario de una entidad que presta asesoria a pequenos establecimientos industriales 
ha realizado un estudio acerca de las diferencias entre la habilidad de los trabajadores para 
aprender el nuevo trabajo y la capacidad para efectuarlo sin supervision. Despues de varias 
semanas de observacion, se ha obtenido la siguiente informacion, donde Y= produccion 
mensual de unidades correctamente producidos y X = anos de educacion de cada uno de los 
10 trabaj adores. 


X: 

7 

5 

6 

4 

10 

8 

6 

5 

10 

6 

8 

Y: 

15 

7 

10 

8 

20 

16 

12 

8 

16 

8 

14 


a) Calcule el Coeficiente de correlacion lineal; b) ^Puede rechazarse la hipotesis de que no existe 
Correlacion lineal a un nivel de significacion del 5%? 

115. Trece estudiantes universitarios de sexo femenino y 13 masculino son clasificados por pares, segun 
su edad y tiempo de experiencia en la conduccion de automoviles. Se les aplica una prueba de 
conduccion con los siguientes resultados. 



a) ^A1 nivel de 1% de significacion, se puede decir que los hombres obtienen un mayor puntaje que 
las mujeres en la prueba de conduccion? 

b) Con la informacion que se tiene, establezca limites de confianza del 95% para la diferencia. 


116. Un Editor esta decidiendo cual de los textos de estadistica que se le han propuesto va a aceptar 
para su publicacion. El uno tiene orientacion tecnica, el otro lo enfoca hacia la aplicacion practica. 
El Editor consulta a 50 instituciones de ensenanza superior para determinar en los tres tipos de 
instituciones sus preferencias. Los resultados fueron: 


TIPO DE ENSENANZA 

TEXTO DE PREFERENCIA 

Orientacion tecnica 

Orientacion practica 

Intermedia 

1 

11 

Tecnologica 

9 

11 

Profesional 

11 

7 


^A1 nivel del 5% se podra concluir que las preferencias son identicas en los tres tipos de institucion? 

117. La desviacion tipica del tiempo de duracion de 120 pilas para radio transistor es de 150 horas. 
Establecer los limites de confianza del a) 95% y b) del 99% para la desviacion tipica poblacional 
de donde se extrajo la muestra. 

118. En 400 lanzamientos de una moneda se observaron 230 caras y 170 sellos. Aplicando la prueba 
de Chi - Cuadrado, comprobar la hipotesis de que la moneda es correcta, al nivel de significacion 
del 5%. 

119. Una muestra realizada a 352 estudiantes correspondientes a dos cursos donde el mismo profesor 
desarrolla la asignatura de matematicas, con el fin de determinar el numero de alumnos que 
aprobaron y perdieron la asignatura, los resultados fueron: 
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CURSOS 

APROBACION 

Si 

No 

A 

144 

34 

B 

128 

46 


A1 nivel del 5% probar que no hay diferencia en cuanto a la aprobacion de la materia. 

120. Un coeficiente de Correlacion obtenido mediante una muestra de tamano 22 fue de 0,46 ^A1 nivel 
del 5%, se puede afirmar que el Coeficiente de correlacion de la poblacion de donde se obtuvo la 
muestra difiere de cero? 

121. Un Coeficiente de correlacion entre 52 familias en cuanto a los niveles de ingresos y gastos fue de 
0,78 ^Puede afirmarse al nivel del 5% que hay Correlacion entre las variables? 

122. Una muestra de 26 observaciones da como resultado un Coeficiente de correlacion de 0,56 y se 
desea saber si el Coeficiente es significativo, al nivel del 1%. 

123. ^Que significa el hecho de que una prueba al Coeficiente de correlacion no sea significativa? 

124. En una fabrica se desea implantar un programa de seguridad que permita disminuir el numero de 
accidentes de trabajo (incluyendo aquellos de poca importancia), se desarrolla una investigacion 
por la Oficina de seguridad, durante una semana, con el fin de probar que los dias de la semana no 
presentan diferencia significativa en la ocurrencia, al nivel del 5%. 

Los resultados fueron: 


DIAS 

Lunes 

Martes Miercoles 

Jueves 

Viemes 

Total 

Numero de 
Accidentes 

10 

3 2 

5 

14 

34 


125. /,Cual es la finalidad de la aplicacion de Chi - Cuadrado? 

126. ^Que se espera concluir al realizar una prueba de independencia? 

127. ^Que diferencia hay entre una prueba de independencia y una de homogeneidad? 

128. i En que consiste la prueba del signo? /,En que casos se emplea? 
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Recordemos que la prueba estadistica solo es el procedimiento experimental que se sigue 
cuando se quiere saber si una hipotesis estadistica es cierta. 

Hay cientos de procedimientos de pruebas estadisticas a disposicion del usuario, que abarcan 
una enorme variedad de aplicaciones. En el capitulo anterior se describieron las mas impor- 
tantes, las que generalmente aparecen en todos los libros de consulta sobre estadistica, siendo 
las pruebas de: a) una sola media muestrab, b) de dos medias muestrales; c) de una proporcion 
y d) de dos proporciones. En todas ellas se hicieron los calculos correspondientes, ademas, se 
establecieron los llmites de confianza. 

En este capitulo no se quiere dejar por fuera otras pruebas, no menos importantes, las que se 
presentan en forma breve, de tal manera que este libro cumpla con las exigencias de la mayoria 
de los programas academicos. Estas pruebas son: 

Observaciones apareadas-Poblaciones dependientes. Resulta que en muchos casos el inves- 
tigador puede preferir la realizacion de experimentos con una misma muestra, con el fin de 
comprobar si se producen cambios de actitud en dos situaciones distintas, que hemos llamado 
antes y despues. En su aplicacion se hace necesario tomar las precauciones correspondientes a 
fin de evitar la presencia de variables extranas, que pudieran interferir en el experimento y con 
ello, se llegaria a conclusiones erroneas. 

Prueba del signo. Dentro de las pruebas no parametricas se le considera la mas sencilla, razon 
por la cual se utiliza erroneamente. Como en la prueba anterior, se toman parejas de observa¬ 
ciones como lo indica su nombre, basandose en el signo de la diferencia para cada par. Su uso 
generalmente conduce a cometer el error el tipo II, es decir, aceptar algo falso. 

Lo distintivo en una prueba no parametrica , es que en ella no es necesario tener ningun cono- 
cimiento acerca del parametro o valor estadistico de la poblacion; por otra parte, se requieren 
mas observaciones que las parametricas a fin de reducir el error, que en la mayoria como ya 
se dijo es de tipo II. 

Chi - Cuadrado o Ji - Cuadrado. Tambien pertenece a las pruebas no parametricas. Gene¬ 
ralmente se utiliza en la realizacion de pruebas de independence, cuando se toma una sola 
muestra que proviene de una sola poblacion, con el fin de establecer si hay alguna relacion en 
cuanto a los criterios de clasificacion; y la prueba de homogeneidad , cuando se trabaja con dos 
o mas muestras provenientes de dos o mas poblaciones y se desea probar que provienen de una 
sola poblacion por su supuesta homogeneidad. Una tabla de contingencia es una matriz, donde 
los elementos (frecuencias) son clasificados en columnas y filas. Si solo se tienen dos colum- 
nas y dos filas nos referimos a una tabla de contingencia de «2 x 2». Si se trata de 4 columnas 
y dos filas sera una tabla de «4 x 2». 

Prueba del Coeficiente de correlacion. Es la interpretacion del grado de asociacion o relacion 
que puede haber entre dos variables; se obtiene con la aplicacion del Coeficiente de correla¬ 
cion al cuadrado o Coeficiente de determinacion R 2 . 
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Generalmente se utiliza el Coeficiente de correlation V para realizar la prueba de significacion. 
Una hipotesis referente a un valor del coeficiente de correlacion en la poblacion, p (la letra 
griega rho o ro), se prueba calculando la probabilidad de que un valor de V difiera de p en tanto 
como el valor de la muestra que pudiera surgir como resultado de solo la variacion del mues- 
treo al azar. En este libro con fines de simplificacion en la simbologia hemos reemplazado a 
rho por R. 

Las pruebas de hipotesis con respecto a la varianza. En muchos casos, este metodo tiene mas 
importancia que la prueba aplicada a un promedio o a una proporcion. Frecuentemente se dice 
que a un fabricante le resulta mas adecuado conocer la variabilidad que presenta su producto, 
que el promedio del mismo. En este proceso de prueba se requiere el uso de la distribucion 
Chi - Cuadrado. 

Correlacion de los rangos. Mide la intensidad de correlacion entre dos conjuntos de ordena- 
mientos y el grado de correspondence entre ellos. Hay dos coeficientes de correlacion de los 
rangos: el de Kendall (1938) y el de Spearman (1904). 

La prueba T de Wilcoxon. Denominada tambien prueba a libre distribucion para la homogenei- 
dad de dos muestras, se basa en propiedades ordinales, y fue propuesta por Wilcoxon en 1945, 
luego desarrollada por otros autores, entre esos Mann-Whitney. 

La prueba U de Mann - Whitney. Fueron quienes desarrollaron la teoria con una presentacion 
activa, sobre la version de la prueba inicialmente presentada por Wilcoxon de ahi que se reco- 
nozca a esta con el nombre de los autores. 

Prueba Hde Kruskal-Wallis . Es una prueba de gran utilidad para decidir si K, muestras inde- 
pendientes son de poblaciones diferentes. La prueba en si, determina si la decision entre las 
sumas de rangos puede ser tan grande que exista la probabilidad de no provenir de la misma 
poblacion de donde fueron tomadas las muestras. 






Numeros 


/ 

Indices 

La rique a de un hombre no 
se encuentra en la cantidad de 
dinero que posee sino en la 
cantidad de su conocimiento 
y educacion. 

avier errera 



CONTENIDO 


Terminos, definiciones, aplicaciones y 
conceptos generales. 

Indices simples. Encadenamiento. Indices 
agregativos simples. 

Indices ponderados de precios y de 
cantidad. Aplicaciones practicas. 

Indices de valor. Empalme de dos o mas 
series. 


■ Usos de los numeros indices (Deflactacion, 
Poder adquisitivo, Salario real, etc.) 

■ Indices de comercio exterior, 
Desvalorizacion y devaluacion, etc.) 


■ Sintesis de la Unidad. 

■ Ejercicios para Resolver, resueltos en el 

Sistema de Informacion en Linea SIL. 

COMPETENCIAS 


El estudiante debera estar en capacidad de: 

□ Entender, aplicar y manejar correctamente 
cada uno de los terminos y formulas para 
ser utilizados en el campo economico, 
educativo, social, salud, etc. 

□ Conocer la importancia que tiene la aplicacion 
de los numeros indices, no solo como 
asignatura, sino en el ejercicio profesional. 

□ Entender y evitar el uso incorrecto, tanto en 
su elaboracion como en la interpretacion del 
mismo. 

□ Familiarizarse con el uso de indicadores, 
que frecuentemente aparecen en los medios 
de comunicacion y que generan polemica 
en su interpretacion. 
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GENERALIDADES 


El n mero indice es una cifra relativa, expresada en terminos porcentuales, que sirve para indicar las 
variaciones que sufre una variable con respecto a un valor de la misma, la cual es tomada como punto de 
referencia, denominada base. 

Como se puede observar los ndices no miden, tan solo sirven para indicar las variaciones en los 
precios, cantidades y valores de un periodo con respecto a otro. 

Para algunos, un numero indice es una cantidad que muestra por medio de sus variaciones, los cam- 
bios temporales o espaciales de una magnitud, que no es en si misma susceptible de medicion directa o 
de observacion directa en la practica. 

En una serie corta, el periodo base corresponded al primer valor de la serie; en una serie larga debe 
seleccionarse un periodo que presente la mayor estabilidad, es decir, que se encuentre lo menos afectado 
por factores internos y/o externos. En algunas ocasiones la base depended de lo que se quiera presentar, 
por ejemplo, si examinamos una serie de precios de un articulo cualquiera, observamos que entre mas 
lejana se encuentra la base, el indice para el ultimo periodo sera mas grande. 

Los rasgos mas importantes en la construction de un numero indice son: su cobertura , el periodo 
base el sistema de ponderacion y el metodo de promediacion de las observaciones. 

Segun la composition, el indice puede ser: Simp e o ompuesto. A su vez los compuestos se cla- 
sifican en agregati os o de promedios y los promedios en: aritmeticos, geometricos, medianos, etc., sin 
embargo los mas utilizados en la vida diaria son los primeros. 

INDICES SIMPLES 


El indice se obtiene dividiendo cada precio, cantidad o valor de un periodo (anual, mensual, semanal, 
etc.), por un precio, cantidad o valor de un periodo fxjo, considerado base, multiplicando luego por cien. 


o 

o 

II 

1 — 1 


o 

o 

ciy 

II 

K -'i 


r=^~ ioo 

'■ V 


Po 


o 

Vo 


X f = valor, cantidad o precio del periodo que se investiga. 

X o = valor, cantidad o precio del periodo tornado como base. 

Se puede calcular el indice manteniendo fijo o constante el periodo base, permaneciendo inalterado 
durante el periodo que es objeto de analisis. Tambien se puede calcular con base ariab e , en este caso, 
la base es el periodo inmediatamente anterior, partiendo de un indice igual a 100,00, bajo el supuesto del 
desconocimiento de information anterior a ese periodo. 

Nota : Es indispensable que usted conozca las diferencias que hay entre indices, porcentajes, progre- 
siones, tasas y razones. Estos terminos son explicados en forma amplia en el capitulo del SIL. 
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Ejemplo 1. Con los datos, de la serie 2006-2011, calcular los Indices de base fija 2006 y 2011; luego el 
indice de base ariab e para esa misma serie: 


a) (Base Fija) 


b) (Base Fija) 


c) (Base Variable) 


INDICE 
2006 = 100 

% 

VARIACION 

100,00 

140,00 

120,00 

200,00 

240,00 

350,00 

0 

+ 40,00 

+ 20,00 

+ 100,00 

+ 140,00 

+ 250,00 


Base 

Variable 

% 

Variacion 

100,00 

140,00 

85,71 

166,66 

120,00 

145,83 

0 

+ 40,00 

-14,29 

+ 66,66 

+ 20,00 

+ 45,83 


Indice 

2009 = 100 

% 

VARIACION 

50,00 

70,00 

60,00 

100,00 

120,00 

175,00 

-50,00 

-30,00 

-40,00 

0 

+ 20,00 

+ 75,00 



En los indices con base fija , observemos el ultimo periodo, mientras que en el primer ejemplo nos 
indica que hubo un aumento del 250 %, para el 2011 con base en el 2006; en el segundo caso (b) el au- 
mento para el 2011 fue apenas del 75% pero con respecto al 2009. 

Para una persona desprevenida, si la variable son precios, puede confundirse con estos resultados, 
si es un sindicato el que presenta el aumento del 250%, pero si la otra presentacion es del gobiemo con 
un aumento en los precios del 75%. Los dos resultados son correctos matematicamente, pero el mensaje 
es diferente, dependiendo de la base que ha sido utilizada en cada uno de los indicadores. 


En el caso del indice de base ariab e las variaciones se establecen con base en el periodo inme- 
diatamente anterior. 


Observemos los procedimientos de calculo en las dos formas, segun se tome la base: 
a) Base fija: 


I 06 = -06 100 =— 100 = 100,00 III = 100 =— 100 = 200,00 


20 


09 _ 1 09 


40 


4 


.07 K 


20 

28 


^06 


20 

48 


7,06 = 201 100 =_ 100 = 140,00 c =— 100 =— 100 - 240,00 


20 


24 


Y<* 


7,06 = 100 a— 100 = 120,00 III = -22 100 =— 100 = 350,00 


n_Yn 


20 


70 


20 


Yq6 


20 


Es mas facil de operar, si calculamos una constante k = ^ = 5 y la multiplicamos por 20; 28; 24; 
40; 48 y 70 obteniendo el mismo resultado, pero en forma mas rapida. 


b) Base variable: 

C 100 = 100,00 1% =— 100 = 166,66 

2(J 2 
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Iol 100 = 1 0,0 

/;;* =— 100 = 85,71 


Im = — 100 = 120,00 

0 

70 

l\o =— 100 = 1 5,8 

o 


ENCADENAMIENTO DE INDICES 

Cuando se tienen indices de base ariab e , estos se pueden transformar en base fija , mediante 
multiplicaciones sucesivas de los relativos para cada periodo o cada eslabon. 

Ejemplo 2. Supongamos con la informacion del ejemplo 1, se quiere determinar la variacion de Y entre 
los periodos 2008-2011 

a) Consideremos la informacion original, que en la mayoria de los casos no esta disponible 

a =^ L 10° => 7 08 =^° 100 =291,67 
^08 ^ 

b) En otros solamente se dispone de informacion en forma de indices. 

I n 50 

7JJ - => 7 os = -100= 291,67 (La base de los indices fue 2006) 

7 06 120 

I n 175 

7os = —=> 7 q§ =- 100 = 291,67 (La base de los indices fue 2009) 

7 09 60 

En los dos casos anteriores el resultado fue el mismo. Ahora hagamoslo con los resultados 
obtenidos con base variable, correspondiente al cuadro posterior. 

7qs = 100 x Rl\ x R™ x R\l x = 100 x 1,6666 x 1,2000 x 1,45833 = 291,65 

Los resultados son iguales, la pequena diferencia observada se debe a los decimales. 

Ahora observemos en el cuadro siguiente el encadenamiento 2006-2011. 


ANOS 

BASE 

VARIABLE 

RELATIVOS 

fNDICE 

ENCADENADO 

2006 

100,00 

1,0000 

100,00 

2007 

140,00 

1,4000 

140,00 

2008 

85,71 

0,8571 

120,00 

2009 

166,66 

1,6666 

200,00 

2010 

120,00 

1,2000 

239,98 

2011 

145,83 

1,4583 

349,96 


r 06 _ 
1 06 " 

= 100 






T 07 = 
i 06 

X 

o 

o 

1,40 = 

140,00 




j 08 _ 
1 06 " 

X 

o 

o 

X 

o 

0,8571 = 

119,99= 120,00 


j 09 _ 

l 06 _ 

X 

o 

o 

X 

o 

0,8571 x 

II 

so 

so 

so 

so 

so 

199,98i 

= 200,00 

f 10 = 
i 06 

= 100 x 

X 

o 

0,8571 x 

1,66666 x 

1,20 = 

239,97 

r 11 = 
i 06 

= 100 x 

X 

o 

0,8571 x 

1,66666 x 

1,20 x 

1,4583 = 349,96 
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INDICES AGREGATIVOS SIMPLES 


En la mayoria de los casos, en forma errada, se calcula este indice sumando los precios, cantidades o 
valores de un periodo que esta siendo investigado, dividiendolo por la suma de los precios, cantidades o 
valores del periodo tornado como base. En algunos casos se considera improcedente este metodo, dado 
que no tiene en cuenta las variaciones que puede sufrir en mayor cuantia alguno de los elementos, de un 
periodo a otro. 


/' = ^ X ‘ x 100 


/' = 5 P ‘ x 100 


I' = J 9 ' x 100 

° IX 


° iPo 


0 


Apliquemos la formula anterior a un caso especifico de precios en un grupo de 5 articulos. 
Ejemplo 3. Supongamos los precios de 5 articulos, para dos periodos 2009 - 2011 


ARTICULOS 

UNIDAD 

DEMEDIDA 

PRECIOS 

2009 

2011 

A 

K/s. 

3.200 

3.200 

B 

Mts. 

1.400 

2.000 

C 

Doc. 

800 

6.000 

D 

Un. 

5.600 

5.200 

E 

Lbs. 

11.200 

12.000 

I 

- 

22.200 

28.400 



En el cuadro anterior se ha calculado el indice de precios de la siguiente manera: 
t t _ X^! 

* n 


100 


I n _ X^n ioo _ 28 00 ioo = 127 9 

09 X4 22 200 UU ^ 


Hay un aumento en los precios del 27,93% para el 2011 con respecto al 2009. 


El anterior procedimiento no refleja la variacion que sufre el articulo C pues de $800 pasa a $6,000, 
con un aumento de ( x ^0 = 750 j del 650%. Para evitar este sesgo o error se procede a calcular el 
indice agregati o simp e , mediante el promedio de los indices simple para cada articulo, como lo muestra 
la ultima columna del cuadro. 


J n X 

*09 = - 


fo9 1 192 86 

100 =- ^r -—= 238,57 el aumento es del 138,57% en vez del 27,93% obtenido por 


n 5 

el primer metodo de calculo. 

La formula para el indice agregativo simple es: 



fi] 

ilJ 

100 

L o - 

n 


INDICES PONDERADOS O COMPUESTOS 


Es aquel, en el cual los items o componentes estan ponderados conforme a un sistema que refleja la 
importancia relativa de los mismos. Por lo general, casi todos los numeros indices estan implicitamente 
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ponderados. Sin embargo, es corriente definirlo como ponderado solo cuando en su expresion y calculo, 
estan explicitamente especificados los coeficientes de ponderacion. 

La ponderacion es el peso o importancia que tiene un item o elemento dentro del conjunto. 

Se cuenta con numerosas formulas para calcular estos indices, cuyo empleo y uso depende de su 
destino. 

Se recomienda utilizar aquella formula que refleje en la forma mas aproximada las variaciones que 
se deseen cuantificar. 

Existen formulas para calcular indices de precios y de cantidad, siendo las mas conocidas las de 
Laspeyres, Paasche, Fisher, Keynes, Marshall - Edgeworth, Drosbisch - Sidgwick y Walsh. 


INDICES PONDERADOS DE PRECIOS 


En los indices de precios las ponderaciones, peso o importancia de cada elemento dentro del conjunto, 
estan dadas por las cantidades y de acuerdo a la manera como estas se tomen, dan origen a diferentes 
formulas, como se presentan a continuacion: 

Indice de Laspeyres 

El indice de precios de Laspeyres, puede interpretarse entonces como la relacion existente entre el valor 
que se obtiene al comparar, a los precios actuales, la misma cantidad de mercancias del precio base y el 
valor de tales articulos en el ano base. 


L i‘ = ZMo ioo 

LPoVo 


p t = Precios del ano que se investiga 
= Cantidades del ano base 


p = Precios del ano base 

r o 

t = Cantidades del ano que se investiga. 


Indice de Paasche 


Permite determinar las variaciones en los precios para un periodo con relacion a un periodo base, 
manteniendo constante como ponderaciones las cantidades del periodo que se investiga. 


Indice de Fisher 


„4 = XMl 

P v 
LP 


Este indice se obtiene al calcular la media geometrica entre los indices de precios de Laspeyres y 
Paasche. 



Zldn x 'LMi 
Z PoVo Z PoQ t 


100 
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Indice de Sidg ic -Drobisch 


Se obtiene promediando (media aritmetica) los indices de precios de Laspeyres y Paasche. 



2 


Indice de Marshall-Edge orth 


Indica las variaciones en los precios entre dos periodos, tomando como ponderaciones la suma de las 
cantidades del periodo base mas las del periodo investigado. 


M 1 '- 


_ Tp, W + ft) 

2>«(ft> + ft) 


100 


Indice de Walsh 


Como los indices anteriores, nos indica las variaciones que se manifiestan en los precios durante dos 
periodos, tomando como ponderacion la raiz cuadrada del producto entre las cantidades del periodo base 
y el investigado. 

w f ‘ = 100 

lAVft ft 


Indice de Keynes 


Toma como ponderaciones las cantidades mas pequenas, ya sean las del periodo base o las del investigado. 

K $ _ T P > minimojg^ .q,) 1Q() 

X Po minimo Wo .ft) 


Ejemplo 4. Supongamos que se tienen los precios y las cantidades de cinco articulos para los periodos 
2009 y 2011. Se desea calcular cada uno de los indices anteriores para determinar las variaciones de los 
precios para 2011 tomando como base 2009. 


Tabla 12.1 Calculo de indices Ponderados 


ARTfCULOS 

UNIDAD DE 
PRECIO 

2009 

2011 

os 

o 

OS 

C? 

cC 

cC 


+ 

os 

o 

+ 

On 

o 

C? 

+ 

os 

O 

cC 

Precios 

Cantidad 

Precios 

Cantidad 

A 

Lts. 

820 

3 

1.000 

3 

2.460 

3.000 

3.000 

2.460 

6 

4.920 

6.000 

B 

Doc. 

530 

5 

500 

8 

2.650 

4.000 

2.500 

4.240 

13 

6.890 

6.500 

C 

Mts. 

1.120 

10 

1.400 

8 

11.200 

11.200 

14.000 

8.960 

18 

20.160 

25.200 

D 

Kls. 

350 

6 

350 

10 

2.100 

3.500 

2.100 

3.500 

16 

5.600 

5.600 

E 

Un. 

200 

2 

400 

3 

400 

1.200 

800 

600 

5 

1.000 

2.000 

I 

- 

- 

- 

- 

- 

18.810 

22.900 

22.400 

19.760 

- 

38.570 

45.300 
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Calculemos los indices de precios de: 
Laspeyres: t/S = ^ P 11 


1 = 


1 P 09 


1 1 


1 = 11 


Paasche: P 1 "' = ^ P " " 1 = - 

Lp 09 ■■ 1 6 


1 = 11 


Fisher: F 1 ™ = ^L 1 " 1 x P'"‘ = pT p ) = 11 


T 11 T ll 

t ii L 09 + n 09 11 + 1 ] 

Sidgwick: S 09 = - — — = - = 11 


Marshall: M 1 ' 09 = ( 09+ n ) \ - - \ - \ \ 

zh P 09 ( 09~*~ ll) 


Tabla 12.2 Continuacion del calculo de los indices ponderados 


09 11 




mmimo 

09 11 

„ / mmimo \ 

Pn ( 09; n) 

_ / mmimo \ 

Pa9 \ 09; 11) 

^ 09 11 

Pi 1 *\/ 09 11 

Po9 *\j 09 11 

9 

3,000 

3.000.00 

2.460,00 

3 

3.000 

2.460 

40 

6,324 

3.162,00 

3.351,72 

5 

2.500 

2.650 

80 

8,944 

12.521,60 

10.017,28 

8 

11.200 

8.960 

60 

7,746 

2.711,10 

2.711,10 

6 

2.100 

2.100 

6 

2,449 

979,60 

489,80 

2 

800 

400 

- 

- 

22.374,30 

19.029,90 

- 

19.600 

16.570 


ri n 
T 'no 


= ^ Pn 100 = 100 = 117,57 

XAi9 \ tfo9 Qn 


19.029,90 


Keynes: K [ ™ = 


XPii 


Fn minima ;q n ) 100 = IMM i 00 = 118,29 
Lp 09 rnmimo[g 09 ;q n ) 16.570 


INDICES DE CANTIDAD 

En los indices de precios, las ponderaciones son las cantidades y en los de cantidades las ponderaciones 
son los precios. Cuando las ponderaciones no se pueden obtener con facilidad durante varios periodos, 
se recomienda utilizar la formula de Laspeyres. 


a) L r ' = P " q ' 100 
LPo 


b) p 


J' 


Up, <h 

Up, q„ 


100 


c) f'‘=JFp*= ISfidL x ZfdL 

V LPo % LPf, % 


100 
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,4 . L 1 '- + P J[ 

2 

O 

o 

+ + 

W w 

ii 

■rf, _ E?/ V/L P, im) 

I+, jp„ p, 

g) K P. _ Idl minimo fc’ p,) 

YjQo minimo (P 0 ; Pi ) 


Ejemplo 5. Utilicemos la informacion obtenida anteriormente, para calcular los indices ponderados de 
cantidad, aplicando las diferentes formulas expuestas. 

Laspeyres: L 1 ” = ^ /?09 11 100 = 19760 100 = 105,05 
X/>09 09 1 8 8 1 0 


Paasche: P J ” = " 100 = 22 90 ° 100 = 102,2 

Xph 09 22 00 


Fisher: F J “’ = x P J ” = ^105,05 x 102,2 = 10 ,6 


Sidgwick: n u 

„ z yo9 _j_ pjo9 105,05 + 102,2 in ^ 

S J = -=-= 10 ,6 

2 2 


Tabla 12.3 Calculo de indices de cantidad 


(P 09 +P 11 ) 

09 (P 09 +^ll) 

l,(P09+Pll) 




Minimo 

Po9’ P\\ 

Vp 09 Pn 

09 P09 Pn 

ii ylP 09 Pn 

1.820 

5.460 

5.460 

905,54 

2.716,62 

2.716,62 

820 

1.030 

5.150 

8.240 

514,79 

2.573,95 

4.118,32 

500 

2.520 

25.200 

20.160 

1.252,20 

12.522,00 

10.017,60 

1.120 

700 

4.200 

7.000 

350,00 

2.100,00 

3.500,00 

350 

600 

1.200 

1.800 

314,63 

629,26 

943,89 

200 

- 

41.210 

42.660 

- 

20.541,83 

21.296,43 

- 


11 r )\ ?Q6 11 19 520 

W Jm = — — 100 = 10 ,67 K Jl " = x 100 = 10 ,61 

20 5 1,8 18 660 


minimo 

09 U* Pn) 

minimo 

11 W Pn) 

2.460 

2.460 

2.500 

4.000 

11.200 

8.960 

2.100 

3.500 

400 

600 

18.660 

19.520 


INDICES DE PROMEDIOS PONDERADOS RELATIVOS 


En la practica, es muy comun utilizar los indices de Laspeyres y Paasche con ciertas modificaciones, 
siendo conocidos como indices promedio ponderados re ati os. 


Los indices de promedios relativos de Laspeyres de precios y cantidad son: 


l(Po %) 

y o 

I p 0 q a 


5>o2o 
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Los indices de promedios relativos de Paasche de precios y cantidad son: 

, i f, 

P L = —=-x 100 />''■ = -^=-- x 100 

LP„9, LPPln 


Tabla 12.4 Continuation del calculo de los indices ponderados relativos 


Pn 

Po9 

11 

09 

(n ) Pn 

\y 09 Q9 j —— 

"09 

(p Y n 

^09 09'- 

09 

0P 09 Pul^- 
"09 

(^11 09^ ~ 

09 

1,21951 

1,0000 

3.000,00 

2.460,00 

3.000,00 

3.000,00 

0,94339 

1,6000 

2.499,99 

4.240,00 

3.999,99 

4.000,00 

1,25000 

0,8000 

14.000,00 

8.960,00 

11 . 200,00 

11 . 200,00 

1,00000 

1,6666 

2 . 100,00 

3.500,00 

3.500,00 

3.500,00 

2,00000 

1,5000 

800,00 

600,00 

1 . 200,00 

1 . 200,00 

- 

- 

22.399,99 

19.760,00 

22.899,99 

22.900,00 


Reemplazando los resultados obtenidos en el cuadro en las formulas anteriores, se tiene que: los 
indices de Laspeyres de precios y cantidad son: 

Y O ) 

^ ^ *09 09' p OO QQ QQ 

L,m = YTp ) 100 = fw 100 = 119 ’ 09 

^ 0Pq9 09 ' 


111 (P09 09^ 11 


100 = ^ 760,00 100 = 105,05 


X(P» »,) 18 810 ’ 00 

Los indices de Paasche seran: 

p 


09 — 


n) ~p — 
*09 

S(Po9 ll) 
I(Pn 09)— 1J - 


22 899 99 

100 = ff|i 100=115 ’ 89 


p j » = —^-— 100 = ll 100=102,2 

i(Pn 09) 22 00 

EJERCICIOS PARA RESOLVER 





La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 


1. Con los siguientes datos sobre produccion de cemento (Miles Ton. metricas) se pide: 


a) Calcular los indices simples, tomando como base el 
mes de enero. 

b) Calcular los indices simples, tomando como base el 
mes de mayo. 


2011 

PRODUCCION CEMENTO 

MESES 

(Miles Ton. Metricas) 

Enero 

185 

Febrero 

178 

Marzo 

220 


ontin a 
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ontinuacion 


Abril 

179 

Mayo 

199 

Junio 

175 

Julio 

216 

Agosto 

207 

Septiembre 

199 

Octubre 

208 

Noviembre 

218 

Diciembre 

213 


c) Calcular los indices simples, con base variable, 


2. Considerando las cosechas de ciertos productos agricolas, determinar el indice agregativo simple 
para 2011 con base 2009, en las dos formas que usted conoce: 


PRODUCTOS 

AGRICOLAS 

COSECHAS 
(Ciento de toneladas) 

2009 

2011 

A 

11.158 

13.044 

B 

1.196 

1.357 

C 

1.111 

1.326 

D 

1.460 

1.840 

E 

859 

997 

F 

1.106 

870 

A 

41 

659 

H 

6.686 

7.978 

B 

204 

202 

£ 

23.821 

28.273 


3. Las cifras de ventas (en miles de millones de pesos) de unos grandes almacenes desde el ano 2001 
hasta el ano 2011 son los siguientes: 


ANOS: 

2001 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

VENTAS*: 

120 

140 

180 

180 

190 

150 

120 

160 

200 

240 

350 


* Miles de millones de pesos 

a) Hallar los indices simples de ventas tomando como base el ano 2001. 

b) Hallar el indice simple de ventas tomando como base el ano de 2004. 


4. El indice de cantidad de un grupo de articulos es igual a 200 si se usa la formula de Fisher y a 160 
si se emplea la de Laspeyres. ^Cual es el valor del indice aplicando la formula de Paasehe? 

5. Un indice para 2010 revela un aumento del 20% respecto del ano anterior. En 2011 alcanzo a 174, 
es decir, presenta un incremento anual del 18%. Calcular los indices de 2009 y 2010. 

6 . Existen tres indices cuyas cifras son: para 2009, 107,83; para 2010, 108,12; para 2011, 104,26; es 
decir, entre 2008 y 2011 el indice eslabonado aumento en un 19%. i Es cierto lo anterior? 

7. Los numeros indices de la produccion de un determinado bien de consumo desde 2005 hasta 2011 
fueron los siguientes: 
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ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

INDICES: 

100,00 

112,14 

115,26 

110,04 

105,00 

110,82 

120,55 


Sabiendo que en 2009 fueron producidas 3 T.m. de dicho bien. Hallar las cantidades producidas 
para los anos 2005 y 2011. 

8 . En 2011 el precio de un artlculo de consumo, bajo en un 29% con respecto al ano anterior, pero en 
cambio, aumento un 50% con respecto al ano 2008. Hallar el numero indice del precio de 2010, 
tomando como ano base a 2008. 

9. El indice de Laspeyres es 2/3 de Paasche y este asciende a 130. ual es el indice de Fisher? 

10. Con la siguiente informacion determine: 


DESTINACION 

PRESTAMOS 
AUTORIZADOS 
(miles de mill. ) 

CREDITOS EN 
NEGOCIACION 

(miles de mill. ) 

SOLICITUDES PLAN 
DE EMERGENCE 
(miles de mill. ) 

TOTAL (miles de 
millones ) 

Vivienda 

25 

50 

175 

250 

Servicios Publicos 

100 

50 

150 

300 

Desarrollo Industrial 

65 

60 

- 

125 

Desarrollo Agricola 

175 

- 

- 

175 

Salubridad 

- 

150 

- 

150 

Totales 

365 

310 

325 

1.000 


1) Las asignaciones para salubridad de acuerdo al Plan Total en relacion con lo asignado al Desarrollo 
Industrial, son aproximadamente: 

a) Inferiores al 1,2% b) Inferiores en 16% e) Superiores en 1,2% 

d) Superiores en 12% e) Igual o superior en 20% 

2) Los prestamos autorizados para el renglon Vivienda, teniendo en cuenta el total programado 
para este, corresponde aproximadamente: 

a) 2 y 1/2% b) 5% e) 6 y 1/4% d) 10% e) 25% 

c) Los prestamos autorizados para Desarrollo Agricola y Vivienda, en relacion al total de 

prestamos autorizados, corresponden aproximadamente al: 

a) 15% b) 16% e) 20% d) 45% e) 54,79% 

11. El indice de costo de construccion de casas de habitacion (base 1996) registro las siguientes cifras: 


ANOS: 

1989 

1991 

1993 

1995 

1997 

2000 

2004 

2011 

ICC*: 

26,74 

59,36 

42,58 

70,62 

108,44 

232,61 

457,49 

1.220,67 


Si el costo de construccion de una casa en 1997 era de $6,200,000, ^a cuanto ascendera en 2011? 
(* ICC = indice de costo de construccion) 


12. En 2011 el precio medio de un bien disminuyo en un 25% con relacion a 2005, pero se incremento 
en un 50% con relacion a 1997. Hallar el indice de precio para 2005 con base 1997. 

13. Con la siguiente informacion, se pide calcular los indices para 2011 con base en 2008, aplicando las 
formulas siguientes: 
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ARTICULOS 

UNIDAD 

2008 

2011 

Precio 

Cantidad 

Precio 

Cantidad 

A 

Kgs. 

2.600 

10 

3.800 

8 

$ 

Kgs. 

6.000 

5 

10.000 

7 

C 

Lts. 

1.000 

2 

4.000 

5 

D 

Doc. 

6.000 

1 

15.000 

2 

E 

Kls. 

3.600 

2 

2.000 

1 


a) Laspeyres, Paasche y Fisher para el indice de precios. 

b) Keynes, Marshall, Sidgwick y Walsh para cantidades. 
e) Laspeyres y Paasche de cantidad. 

14. Con los siguientes indices eslabonados, se pide encadenarlos, tomando como periodo base el primer 
ano de la serie. 


ANOS: 

1 

2 

3 

4 

5 

INDICE ESLABONADO: 

103,15 

108,36 

94,86 

117,28 

104,84 


15. El indice nacional en costos de la construccion de vivienda para el periodo 2006 / 2011 es el 
siguiente: 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

INDICE 2001 = 100: 

161,52 

205,68 

235,34 

283,15 

371,28 

495,82 


Si el valor promedio de una vivienda de 2 pisos, con 3 alcobas, sala, comedor, cocina y patio de ropas 
es de $31,000,000 para 2006, de acuerdo al incremento del indice, ^Cual sera el valor en 2011? 


16. Para los siguientes articulos: 


ARTICULOS 

UNIDAD 

PRECIO PROMEDIO 

CONSUMO (por mes) 

2009 

2011 

2009 

2011 

A 

Libra 

2.450 

2.605 

6 

8 

B 

Libra 

426 

750 

2 

3 

C 

Litro 

472 

740 

80 

65 

D 

Docena 

1.275 

2.583 

3,50 

2,50 

E 

Kilos 

1.192 

1.370 

18 

27 


Se pide calcular: 

a) Los indices ponderados de precios de Laspeyres, Paasche y Fisher, tomando como base 2009. 

b) Los indices ponderados de cantidad de Laspeyres, Paasche y Fisher, tomando como base 2009. 


17. Las ventas realizadas por un almacen de repuestos en el periodo 2005 / 2011 fueron las siguientes: 


ANOS : 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

VENTAS: 

12.320 

14.563 

18.624 

27.632 

24.830 

29.316 

32.514 


* Millones de pesos 

Se pide calcular: 

a) Los relativos en cadena. (Indices eslabonados). 
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b) Encadene la serie obtenida en el punto (a), tomando como base 2005. 

c) Obtenga el indice para la serie, tomando como base 2007. 

18. El indice de precios calculado mediante la formula de Fisher es de 107,7. Ademas, se sabe que 
el indice de cantidad de Paasche es de 138,71 y el indice de precios de Paasche 136,06. Se pide 
calcular el indice de valor. 

19. Dados los siguientes datos: 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

INDICE 2000 = 100 : 

182,63 

204,28 

210,34 

214,36 

286,49 

322,24 


Se pide calcular los indices, tomando como base 2006. 


20. Que nos indica cada uno de los siguientes indices: 

a) El indice de precios de Laspeyres. 

b) El indice de cantidad de Laspeyres. 
e) El indice de precios de Paasche. 

d) El indice de cantidad de Paasche. 

21. En 2009 la produccion de una determinada firma aumento en un 30% con respecto a 2008. En 2010 
la produccion bajo un 10% con respecto a 2009, pero en 2011 se supero en un 15% con respecto al 
ano anterior. Hallar los numeros indices simples de cantidad, para el periodo 2009 / 2011; tomando 
como base el ano 2008. 

22. En una investigacion nacional de morbilidad, se le hizo examen de “agudeza visual de lejos” a 
3.400 ninos de 8 a 12 anos de edad y se obtuvieron los siguientes resultados: 


Normales 

3.209 

Con diferencia leve 

161 

Con diferencia moderada 

22 

Con diferencia severa 

8 


Se pregunta por las tasas de cada uno de los niveles de agudeza visual por mil personas en la edad 
de 8 - 12 anos. 

23. Con los siguientes datos correspondientes a dos periodos, se pide calcular: 


ARTfCULOS 

2009 

2011 

Precio 

Cantidad 

Precio 

Cantidad 

A 

1.300 

10 

1.600 

16 

B 

2.600 

14 

2.000 

20 

C 

600 

8 

3.600 

6 

D 

4.800 

12 

4.800 

14 


a) Los indices simples de precios para los dos periodos. 

b) El indice agregativo simple de precios. 

e) Los indices de Fisher de precios y de cantidad. 

















CAPfTULO DIEZ 

NUMEROS INDICES 


493 


INDICE DE VALOR 


El mdice esta formado por la razon entre la sumatoria de valores (precio por cantidad) correspondiente 
al periodo investigado y la sumatoria de valores correspondientes al periodo base, al final multiplicado 
por cien. 

Precio X Cantidad = Valor ^ £ PQ = Sumatoria de valores 



100 


LPoVo 


Ejemplo 7. Utilicemos los ejercicios anteriores en donde se obtuvo: 

E/?n u = u = 22.900 y Z /? 09 09 = 09 =18810 con lo cual calculamos el indie e de valor para 

los dos periodos =- 1 =11 . Sin embargo, este procedimiento puede ser reempla- 

zado, utilizando los indices de Laspeyres y Paasche asi: 

I' 0 l = x pJ ' : = H9 09 (l 0223) = 121 745 
III = J " x P 1 ” = 105 05 (l 1589) = 121 742 

Vale la pena observar en las anteriores operaciones, que los indices no pueden ser multiplicados 
entre si, dado que serian multiplicados dos veces por cien, de ahi que uno de ellos debe ser expresado en 
valor relativo. 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

24. Conocidos los indices de precios y de cantidad de Paasche, ademas, el indiee de valor. ^Como se 
pueden obtener los indices de precios y de cantidad de Laspeyres? 

25. De un cierto producto tenemos los siguientes numeros indices simples de precios y de valor: 


ANOS 

INDICE DE PRECIOS 

(Base 2007 = 100) 

INDICE LE VALOR 

(Base 2003 = 100) 

2007 

100,00 

210,00 

2008 

120,12 

250,06 

2009 

130,24 

280,31 

2010 

160,86 

320,28 

2011 

180,08 

350,34 


Hallar los numeros indices de cantidad con base en 2007. 


26. En enero de 2011 una fabrica pago un total de $90,000,000 a 120 empleados en nomina. En junio 
del mismo ano, la fabrica tenia 30 empleados mas en nomina y pago $22,500,000 mas que en enero. 
Tomando el mes de enero como base, hallar: 
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a) El indice de empleo (cantidad relativa para junio). 

b) El indice del costo de mano de obra (valor relativo). 

e) Mediante la igualdad precio relativo por cantidad relativa = valor relativo. /,Que interpretacion 
podria darse al precio relativo en este caso? 

27. En 2011 el precio de un cierto bien de consumo aumento en un 60% por encima del de 2008, 
mientras que su produccion disminuyo en un 40 % ^En que porcentaje aumento o disminuyo el 
indice de valor de dicho bien en 2011 respecto a 2008? 

28. Una empresa espera aumentar sus ventas en el ano proximo en un 50%. i En que porcentaje debera 
incrementar los precios para que el ingreso total se convierta en un 250%? 

29. Un departamento de estadistica le entrega a usted los siguientes indices, calculados para una serie 
de articulos. 

j o = 115,23 F ] o = 125,32 7 » = 130,65 Calcular I‘ 0 

30. Una compania espera incrementar sus ventas en un 34% en el proximo ano. /,En que porcentaje 
debera incrementar el precio de venta para que el ingreso total se triplique? 

31. Un comerciante vende un articulo en $ 38.000 y busca una ganancia del 18,62 %. i En cuanto 
compro el articulo, para luego venderlo por ese precio? 


EMPALME DE DOS O MAS SERIES DE INDICES 


En numerosos casos los indices de una serie, amese indice de precios a consumidor o de cualquier otra 
serie de precios, cantidad o valor, se suspende porque la informacion utilizada al conformar la base ha 
cambiado a traves del tiempo, considerandose no representativa, dando lugar a la necesidad de elaborar 
una nueva serie de indices, con una nueva base. El indice deja de ser representativo cuando aparecen 
nuevos items, o desaparecen algunos otros que han venido siendo utilizados en el calculo. 

El metodo que permite realizar el cambio, para continuar la serie que ha sido suspendida o para 
conocer los indices anteriores a la nueva base, se conoce con el nombre de empa me. (Hacia arriba o 
hacia abajo). 

Ejemplo 8. Con los siguientes datos correspondientes a dos series con distinta base, se pide empalmarlas, 
primero para los meses del 2011 (empalme hacia abajo) y luego para los meses y anos anteriores. 
(Empalme hacia arriba). 

El empalme hacia abajo lo hacemos mediante la aplicacion de una regia de tres simple asi: 

106 21 -> 1 644 06 x _ 1.644.06 (115.86) = i 793 44 

115 86 -> X 106,21 

= 1 . 644 , 06 ( 121 , 34 ^ 1 878,26 
106,21 


106 21 
121 34 


-> 1 644 06 
-> X 
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ANOS 

MESES 

INDICE DEPRECIOS 

ALCONSUMIDORPARA 

EMPLEADOS 
(Basejul. 97-jun. 98) 

INDICE DEPRECIOS 

ALCONSUMIDORPARA 

EMPLEADOS 

Abril 1 10 = 100 

2001 

Marzo 

233,78 

15,10 


Agosto 

240,42 

15,53 

2003 

Febrero 

433,56 

28.01 

2005 

Octubre 

536,53 

34,66 

2006 

Abril 

897,81 

58,00 


Julio 

929,60 

60,05 


Diciembre 

1.103,04 

71,25 

2010 

Enero 

1.460,08 

94,32 


Junio 

1.644,06 

106,21 

2011 

Enero 

1.793,44 

115,86 


Febrero 

1.878,26 

121,34 


Marzo 

2.344,81 

151,48 


Abril 

2.883,95 

186,31 


Mayo 

3.294,31 

212,2 


Sin embargo, es mas facil calcular una constante y multiplicarla por cada indice del periodo utili- 
zado para el empalme. 


1 6 ,06 
106,21 


= 15, 79 


J 115,86 = 1 79 , 

[121, = 1 878,26 y asi sucesivamente. 


En el empalme hacia arriba se invierten los calculos asi: 


1.6 ,06 -> 106,21 
1 . 60,08 —> x 

K = 0,06 602265 x 


6 la constante K 


106,21 
1.6 ,06 


0,06 602265 


J1 60,08 = 9 , 
j 90 ,0 =71: 


2 

25 


Nota: en la calculadora se realizan los calculos utilizando todos los decimales. 


EJERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 
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32. Con los siguientes datos: 
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ANOS 

MESES 

INDICE (1989 = 100) 

INDICE (mayo 10 = 100) 

2001 

Diciembre 

2.382,68 


2003 

Mayo 

2.763,21 


2008 

Junio 

4.326,42 


2010 

Enero 

5.128,23 



Abril 

5.312,61 



Septiembre 

5.824,25 



Diciembre 

6.010,34 

112,61 

2011 

Enero 


114,52 


Febrero 


118,63 


Marzo 


120,11 


a) Empalmar la serie obteniendo los indices para enero, febrero y marzo de 2011 con base 1989. 

b) Obtener los indices para diciembre/01; mayo/03; junio/08 y enero, abril, septiembre de 2010 
con base mayo 2003. 

33. Dados los siguientes datos, empalmar las dos series de indices. 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

INDICE 2001 = 100 

328,32 

352,46 

370,63 

- 

- 

- 

INDICE 2008= 100 

- 

- 

100,00 

105,61 

108,89 

111,23 


34. Con la siguiente informacion, realice el empalme de dichas series. 


ANOS: 

1 

2 

3 

4 

5 

6 

fNDICEA: 

100,00 

98,36 

110,14 

135,36 



fNDICE B: 




100,00 

108,12 

96,84 


ALGUNAS APLICACIONES DE LOS NUMEROS INDICES 


Veamos, en forma bastante resumida, algunos de los indicadores mas importantes, usados con frecuencia, 
y que reflejan no solo la situacion economica, sino otros aspectos diarios de la vida social y politica de 
una region o pais. 

INDICE DE PRECIOS AL CONSUMIDOR (IPC) 

“El IPC es un indicador estadistico, que permite establecer las variaciones en el gasto del consumo final 
promedio de los hogares, atribuido exclusivamente a los cambios en el nivel general de precios entre los 
periodos de tiempo determinados, de un conjunto representativo de bienes y servicios adquiridos por la 
poblacion en referenda (hogares) para su propio consumo”, segun el DANE, Departamento Nacional de 
Estadistica de Colombia. 

Durante 1996 se adelanto el procesamiento, depuracion y produccion de resultados obtenidos en la 
encuesta de ingresos y gastos familiares realizados con anterioridad, con el fin de actualizar el IPC, cuya 
nueva base corresponds a diciembre de 1998. 
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La cobertura geografica correspondio a 13 ciudades capitales de departamento, para un total de 
20.000 establecimientos y 80.000 cotizaciones, siendo su recoleccion mensual. Los establecimientos que 
incluyo la muestra correspondio a los de comercio al por menor, viviendas en arrendamiento, educativos, 
servicios medicos, diversion, esparcimiento y financieros. 


En este IPC se amplio la clasificacion de los diferentes bienes y servicios, de 4 a 8. 

Elios son: 


1. Alimentos 

5. Educacion 

2. Vivienda 

6. Diversion, cultura y esparcimiento 

3. Vestuario y calzado 

7. Transporte y telecomunicaciones 

4. Servicios medicos 

8. Otros gastos 


La canasta familiar fue constituida por 402 especificaciones, a las cuales se les hacia seguimiento 
de precios. 

Es tan importante y variado el uso de este indice, que explicaremos a continuacion algunos de ellos. 

Poder adquisitivo (PA). Es denominado tambien como poder de compra y resulta de dividir la unidad 
monetaria, en nuestro caso el peso, por el IPC. Esta proporcion se multiplica por 100. 

PA=(l+IP ) 100 

Si consideramos hipoteticamente que en diciembre de 2011 el IPC es 320,6 y su base es diciembre 
del 2005, el poder adquisitivo sera igual a: 

PA = (l - 320,6)100 = 0,3119 

Lo anterior significa que un peso ($1) en diciembre de 2011 respecto al 2005 tendra un valor real 
aproximadamente de 31 centavos, es decir, que el poder de compra entre estos dos periodos, ha dismi- 
nuido en 69 centavos; por lo tanto, el consumidor necesitara mas dinero para poder comprar la misma 
cantidad de articulos que adquirirla en diciembre de 2005. 

Podriamos decir tambien que $1,000 en el 2011, tendran un valor real de $310, siendo su poder de 
compra actual, aunque el billete aparentemente diga mil pesos. 

El indice de poder adquisitivo se calcula con los indices de precios al consumidor que se tenga para 
los periodos comparados. En este caso, se tiene que para el mes de diciembre de 2005, el indice es de 100 
y para diciembre de 2011 supuestamente es de 320,6. 


IPA = (100,0 - 320,6)100 = 31,19% 


Es decir, que el poder de compra es del 31,19% para el 2011 con respecto a diciembre del 2005. 
El porcentaje de desvalori acion. Se obtiene aplicando la siguiente formula: 


IPC { 


IPA = (IP o IP f ) 100 
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Podemos utilizar la informacion anterior para el calculo, por lo tanto, se tendra: 
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= 100 


1 - 


100 

20,6 


68,81 


La desvalorizacion del peso ha sido del 68,81%, lo cual significa que en ese porcentaje deberia 
haber reajustado el salario durante el periodo, para que en el 2011 tenga un valor igual al que tenia en el 
periodo base. 

Por desvalorizacion se entiende la perdida de poder de compra que tiene el dinero en 
relacion con los precios intemos de mercado. 

En los tres casos de aplicacion mencionados, se han tenido en cuenta los indices obtenidos en esos 
periodos. 

Ejemplo 9. Supongamos que se tienen dos periodos, para los cuales se conoce los IPC con una misma 
base, siendo 396,48 y 480,53; correspondientes al mes de Enero/10 y Enero/11, la base es Mayo/05. Se 
pide calcular (a) Poder adquisitivo, (b) el indice de P.A. y (c) El porcentaje de desvalorizacion con base 
en Enero de 2010. 


a) Primero cambiamos la base, para los IPC siendo Enero/10 =100 


Indice Enero 2010 = — ^ 100 = 100 

80,5 
96, 8 


6 , 

Luego, para enero de 2011 sera: 


El poder adquisitivo sera: PA 


= 1 


121,20 


100 = 121,20, hay un aumento del 21,20% 

100 = 0,8251, es decir, se registra una perdida de: 


1 - 0,8250 = 0,1749 del 17,49% 

b) El indice de poder adquisitivo sera: IPA = ^2\ 20 100 = 82,51 


100 


c) El porcentaje de desvalorizacion =100 


1 - 


96, 8 


80,5 


= 17,49% 


Indexation. Consiste en vincular el valor de un capital o de una renta a la evolucion de una variable 
de referencia, generalmente precios, produccion, productividad. Numerosos profesionales, hablan de 
indizacion, que consiste en la accion de unir el valor de los salarios con la evolucion de una variable de 
referencia, siendo de mayor frecuencia, el indice de precios al consumidor para preservar el poder de 
compra de los ingresos salariales, en periodos de alzas de precios o inflacion. 


Son terminos muy comunes, especialmente para el economista, dejiactar , deflactacion , deflactador, 
inde ar. Dejiactar es el proceso mediante el cual transformamos un valor o una serie dada en valores 
monetarios a precios corrientes (es decir, precios de mercado), a precios constantes de un periodo de- 
terminado, tornado como punto de referencia. Mediante la deflactacion podemos determinar los cambios 
en el volumen real de valores de una serie. 


Podemos observar, que la mayoria de las informaciones sobre valores correspondientes a inversion, 
produccion, salarios, etc., dados en sus respectivos valores monetarios, a menudo estan distorsionando la 
realidad, pues no muestran los cambios a nivel de precios corrientes. 

Cada serie necesita de un indice deflactor propio, pues de lo contrario podriamos estar falseando la 
informacion. Generalmente se emplea el indice de precios al consumidor, para la deflactacion o indexa- 
cion de series monetarias. 
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Ejemplo 10. Hagamos un ejercicio hipotetico sobre ventas (en miles de millones de pesos) en los ultimos 
6 anos, a precios corrientes. Se desea deflactar utilizando el indice de Precios al Consumidor (valores 
arbitrarios). 


Tabla 12.4 Indice de venta a precios corrientes y constantes 


IPC 

2006 = 100 

VENTAS A PRECIOS 
CONSTANTE DE 2006 

Indice de ventas 

Precios corrientes 

Precios constantes 

100,00 

38,00 

100,00 

100,00 

129,64 

35,48 

121,05 

93,37 

153,61 

35,15 

142,11 

92,50 

170,31 

36,40 

163,15 

95,79 

193,51 

40,31 

205,26 

106,08 

212,14 

40,54 

226,32 

106,68 


ANOS 

VENTAS 

(miles de millones ) 

IPC 

2000 = 100 

2006 

38 

225,61 

2007 

46 

292,48 

2008 

54 

346,56 

2009 

62 

384,23 

2010 

78 

436,58 

2011 

86 

478,60 


Procedimiento a seguir: 

1. Cambiamos la base del indice de precios, (anteriormente 2000, ahora la nueva base es 2006). 
Calculamos la constante K = (100 4- 225,61) = 0,443242764 y la multiplicamos por 
225 61 = 100; por 292,48 = 129,64 ; por 346,56 = 153,61 etc. 


2). Deflactamos, dividiendo las ventas de cada periodo por el respectivo indice de precios con base 


2006 


38 

Too 


100 = 38 


46 

129,64 


100 = 35,48 


54 

153,61 


100 = 35,15 


3). Observamos como han variado las ventas a precios corrientes y a precios constantes. Mientras 
que para 2011 las ventas (a precios corrientes) aumentaron en un 126,32%, a precios constantes 
o reales el aumento apenas fue del 6,68%, con respecto al 2006. 


Salario nominal y salario real. Son dos terminos de uso diario en los que interviene el IPC, ya 
que es utilizado para deflactar, es decir, con ertir a ores o precios corrientes o de mercado a precios 
constantes respecto a una base. En este caso, el salario nominal se puede transformar en salario real. 


Salario real = (Salario nominal ■¥ IPC) 100 


Si una persona, en Enero de 2010, devengaba un salario de $900 mil y en Enero de 2011 de $950 
mil, se observa que el salario fue reajustado en 50 mil pesos, mejorando su salario nominal. Esta persona 
consulto el IPC para los mismos periodos: 264,94 y 320, 6, respectivamente, con base en diciembre de 
2011. 

Si cambiamos la base, al 2010 = 100,0; en 2011 sera igual a ( 320,6 -h- 264,94 ) 100 = 121,01, es 
decir, los precios se incrementaron en un 21,01% para el periodo de referencia. Luego, el salario real 
para 2011 sera: 


SR - (950.000 ^ 121,01) 100 - 785.059,09 
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Este trabajador desmejoro su salario en $164,940,91 respecto al de 2010. Si se desea que esta per¬ 
sona devengue un salario real igual al de 2010 se obtendria asi: $900,000 (1,2101) = $1,089,090, en vez 
de los $950,000 en que fue reajustado su salario. 


TASADE CAMBIO (TC) 


Se usa para obtener algunos indicadores relacionados con las variaciones del tipo de cambio, es decir que 
refleje los cambios en la cantidad de dinero que se da por un dolar, o cualquiera otra unidad monetaria 
extranjera. 

ndice de la tasa nominal de cam io 
= Tasa de cambio actual 
= Tasa de cambio que se toma como base. 

Ejemplo 11. Se tiene que actualmente la tasa de cambio es $2,982,5 y se quiere determinar el indice de 
la tasa nominal, respecto a un periodo base cuyo valor era 2.782,6 por dolar. 

Solucion: 


l =(, JjOO 


ITC = (2.982,5 - 2.782,6)100 = 107,18 

Quiere decir que la tasa de cambio ha aumentado durante ese periodo en un 7,18%. Directamente 
se hubiera podido calcular el porcentaje de variacion, asi: 


% de variacion =100 



= 100 [(2 982 5-^2 782 6) - l] = 7 18 


Nota: Se puede determinar el indice real de cambio, del peso colombiano, si se deflacta por el 
indice de precios al productor. 


Indice de devaluation (ID). Nos permite determinar la perdida de poder de compra de nuestro dine¬ 
ro en re acion a os precios de mercado e terno es decir, el dolar o cualquiera otra moneda extranjera. 

ID = (2.782,6 - 2.982,5)100 = 93,30% 

Indice de tasa de cambio real. Es la tasa de equilibrio creada por el Banco de la Republica en 1994 
para establecer el precio del dolar y facilitar las operaciones de comercio exterior colombiano. Se calcula 
en forma mensual teniendo en cuenta el precio de las divisas de veinte de los paises con mayores tran- 
sacciones de Colombia con el exterior. Antes de 1994 existia una formula en la cual incluia 40 paises. 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 

35. Deflactar la serie cronologica de las cantidades pagadas por las Companias de Seguros, por siniestros 
ocurridos en un pais X durante el periodo 2007-2011 tomando como deflactor el indice costo de 
vida. 



iD = {r 0 +T')\ 
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ANOS 

SINIESTROS 
(miles de mill. ) 

INDICE DE PRECIOS 

AL CONSUMIDOR 

(1995 = 100) 

2007 

318.511 

643,12 

2008 

523.926 

712,45 

2009 

670.718 

807,78 

2010 

905.661 

866,70 

2011 

1.036.129 

876,93 


36. Comprobar los siguientes puntos: 

a) Si el tipo de cambio sube de $2,662,0 a $2,871,0 por dolar ^se dice que la devaluacion ha sido 
del 9,63 %? 

b) Si la devaluacion entre dos periodos fue de 9,83 %, siendo el tipo de cambio para el ultimo 
periodo de $2,320,5 ^Cual fue el tipo de cambio para el periodo base? 

c) El indiee de precios al consumidor sube en un 7,83%, /,Se considera que el indice de poder 
adquisitivo baja en un 5,23%? 

37. En los registros de inventario de equipo que lleva una compania aparecen los siguientes Costos de 
adquisicion (millones de pesos). Ademas se tienen los indices de precios del equipo en la industria 
metalurgica. 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

COSTOS (mill. $): 

124,6 

136,2 

148,5 

210,6 

217,4 

252,6 

INDICE 2001 = 100: 

142,28 

186,16 

195,34 

234,15 

260,16 

275,28 


Obtenga el costo real de la maquinaria a precios del 2006. 

38. Para el estudio del Producto Bruto se han tornado tres sectores y sus valores agregados (en miles de 
millones de pesos): 


SECTORES 

2008 

2009 

2010 

2011 

Agricultura 

2.000 

3.100 

6.000 

8.100 

Servicios y otros 

4.000 

5.800 

9.000 

10.500 

Industria 

2.600 

3.800 

5.500 

7.300 


Por otra parte se dispone de los siguientes indices deflactores: 


Indices 

2008 

2009 

2010 

2011 

Indice de precios del productor 

100,00 

120,82 

140,56 

170,15 

Indice de precios al consumidor 

80,54 

100,00 

130,80 

150,36 

Indice de produccion 

110,63 

125,32 

135,42 

140,42 


a) Calcule el producto bruto real, para los cuatro anos, en unidades monetarias de 2008. 

b) Calcule el indice del producto bruto real con base 2008. 
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39. Los siguientes datos se refieren al monto total de los salarios nominales pagados por una empresa X 
(en miles de $) y a los indices del costo de vida 
(Base 2001 = 100). 


ANOS 

SALARIOS NOMINALES 

fNDICE (2001 = 100) 

2007 

232.000 

320,83 

2008 

235.500 

325,12 

2009 

286.000 

328,42 

2010 

338.000 

350,63 

2011 

440.000 

360,54 


Se pide calcular: 

a) Los salarios reales para cada ano (base 2007). 

b) El indice del poder adquisitivo para cada ano (base 2007). 

c) El poder adquisitivo con base 2001. 

40. Con los siguientes datos obtenidos en el sector de la economia: 


ANOS 

SALARIOS 
(miles mill. ) 

OBREROS 

(miles) 

fNDICE DE PRECIOS AL 
CONSUMIDOR (2001 = 100) 

2005 

1.800 

120 

140,23 

2006 

2.060 

180 

148,11 

2007 

2.300 

200 

152,63 

2008 

3.800 

300 

160,21 

2009 

5.100 

420 

166,08 

2010 

5.800 

450 

168,26 

2011 

6.000 

510 

170,32 


a) Calcular los salarios reales con respecto al 2005. 

b) Calcular los salarios nominales per-capita. 

c) Calcular los indices de salarios reales, a precios de 2005. 

d) Calcular los indices de salarios nominales per-capita. 

e) Calcular los salarios reales per-capita, a precios de 2005. 

f) Calcular los indices de salarios reales per-capita, a precios de 2005. 

41. Dados los siguientes datos sobre los salarios mensuales (miles de $) e indices de precios al 
consumidor con diferente base, encontrar si el salario real mensual es mayor o menor para 2011 , 
que en 2006. 


ANOS 

SALARIOS MENSUAL 
(miles de ) 

IPC 

(2001=100) 

IPC 

(Mayo 08 = 100) 

2006 

400 

142,39 


2007 

500 

160,51 


2008 

1.100 

280,32 


2009 

1.300 

420,16 

110,18 

2010 

1.500 

- 

120,36 

2011 

1.900 

- 

140,56 




















CAPfTULO DIEZ 

NUMEROS INDICES 


503 


42. Dados los salarios mensuales (miles de $) e indices de precios al consumidor, encontrar si el salario 
real mensual (miles de $) es mayor o menor en 2011 con relacion al obtenido en 2004. 


ANOS 

IPC 

(2001 = 100) 

IPC 

Base Variable 

SALARIOS MENSUALES 

(miles de ) 

2004 

130,86 

- 

400 

2005 

146,32 

- 

600 

2006 

150,14 

- 

800 

2007 

170,78 

100,30 

1.100 

2008 

- 

110,18 

1.300 

2009 

- 

90,36 

1.800 

2010 

- 

115,14 

2.200 

2011 

- 

112,26 

2.500 


ANOS : 

2001 

2002 

2003 

2004 

2005 

2006 

IPC* : 

464,53 

532,98 

607,31 

759,42 

963,53 

1.136,04 








ANOS: 

2007 

2008 

2009 

2010 

2011 


IPC* : 

1.430,41 

1.849,32 

2.179,28 

2.376,42 

2.516,83 



*indice de Precios al Consumidor: 2001 - 2011 

Con la serie de indices de precios al consumidor de 2001 al 2011, calcular el poder adquisitivo del 
peso para cada uno de los anos, tomando como base 2001. 


44. Cuando el indice de costo de vida sube en un 25%, ^el indice del poder adquisitivo baja en un 20%? 

45. Las informaciones del cuadro siguiente, corresponden al ingreso nacional de un pais por rubros, en 
miles de millones de unidades monetarias. 


RUBROS 

2007 

2008 

2009 

2010 

2011 

1. Salarios y prestaciones sociales 

298,1 

326,2 

546,4 

680,4 

820,2 

2. Arriendos 

50,6 

79,1 

113,9 

139,5 

180,5 

3. Intereses y utilidades 

87,7 

173,0 

222,7 

250,2 

280,6 


Ademas se tiene la siguiente informacion: 


Indices anos: 

Indice precios consumidor 2011 = 100 
indice Precios del productor 2000 = 100 
Indice precios vivienda 2009 = 100 

2007 

24,51 

480,82 

49,84 

2008 

38,06 

847,86 

83,67 

2009 

63,28 

1.390,04 

100,00 

2010 

81,42 

1.979,56 

115,62 

2011 

100,00 

2.483,06 

120,46 

Poblacion en millones 

7,8 

8,0 

8,2 

8,4 

8,7 


a) Calcular el ingreso nacional real (total y per-capita) a precios de 2007. 

b) Calcular los indices de ingreso nacional real y per-capita con base 2007. 



46. Un empleado ganaba $632,000 mensuales en 2009. Hoy dia percibe $972,000 con lo cual mejora su 
ingreso real en un 37%. Si el indice de precios para hoy (2011) es de 560,80 ^Cual era el de 2009? 

47. El tipo de cambio de $2,829,8 por dolar significa una devaluacion del peso de 37%. ^Respecto a que 
cotizacion? 

48. La desvalorizacion monetaria en un pais determinado aumenta cada ano, durante el periodo 2005- 
2011 en un 10% constante, respecto al ano anterior. Corregir la siguiente serie de valores de la 
depreciacion monetaria. 
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ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

Valores: 

3.000 

9.000 

12.000 

20.000 

25.000 

26.000 

30.000 


INDICES DE COMERCIO EXTERIOR 


En su elaboracion se cuenta con la informacion necesaria, que se recopila mediante la utilizacion de 
los manifiestos de aduana. Se tienen dos indices: de precios de cantidad , tanto para exportacion como 
para importacion, con la diferencia de que al primero se le conoce como ndice de a ores unitarios 
(IVU) ya que no es precisamente un precio, sino el cuociente valor -r- cantidad = p obteniendose un 
valor unitario promedio de kilos, maquinas, telas, televisores, etc. Algo similar sucede con los indices de 
cantidad, denominados ndices de uantum (de cantidades o volumen fisico) ya que en la mayoria de los 
casos, las mercancias, por razones arancelarias, se expresan en kilos; por tal razon es preferible utilizar 
el termino uantum en vez de cantidad. 


Algunos de los usos de estos indices, se emplean para calcular: la re acion de precios de Intercam- 
bio (RPI) y el ndice de apacidad para Importar (ICM). 

Indice relacion de precios de intercambio. El indiee de Relacion de Precios de Intercambio se 
obtiene, dividiendo el ndice de a or unitario de e portacion (IVUX) por el ndice de a or unitario de 
Importacion (IVUM) multiplicando el cuociente por cien. 


Este indice puede ser favorable para el pais si es mayor del 100%, cuando 
los precios de los articulos que se exportan mejoran de precio en los merca- 
dos internacionales, mientras que el precio de los articulos que se importan se mantiene igual o el 
aumento es inferior a los precios de las exportaciones. 

Indice de capacidad para importar. Se obtiene al multiplicar e ndice de re acion de precios de 
intercambio por e ndice de uantum de e portaciones (IQX). Es de anotar que uno de ellos debe estar 
dado en valores relativos, para que no quede multiplicado dos veces por cien. 

ICM = (IRPI) (IQX) 

Ejemplo 12. Supongamos que se dispone de los indices de valor unitario de importacion y de exportacion 
lo mismo que del indice quantum de exportacion, para calcular los indices de Relacion de Precios de 
Intercambio y los indices que muestren la capacidad para importar. 


IRPI = J—CX. i oo 
I UM 


Tabla 12.6 Indice de relacion de precios de intercambio y capacidad para importar 


ANOS 

Indices (2001 = 100 ) 

Exportacion 

Importacion 

2005 

126,41 

110,52 

2006 

132,62 

108,63 

2007 

120,48 

109,42 

2008 

116,61 

110,61 

2009 

128,24 

111,20 

2010 

136,43 

108,31 

2011 

144,81 

114,56 


RELACION 

NETA 

DE CAMBIO 

Indice 

QUANTUM DE 
EXPORTACION 

114,38 

105,82 

122,08 

107,31 

110,11 

109,22 

105,42 

110,15 

115,32 

110,83 

125,96 

111,21 

126,41 

111,86 


INDICE 
CAPACIDAD 
PARA IMPORTAR 


121,04 

131,00 

120,26 

116,12 

127,81 

140,08 

141,40 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

49. Se conocen los indices de comercio exterior de un pais: R = indice de relacion de precios de 
intercambio. 

Qx = indice de quantum de exportacion. 

R 06 = 110,18 R% = 80,36 Rll =120,14 Rll =115,20 R\l =116,18 

°ol = 90,36 S =120,12 SS = 90,34 £ = 100,00 £=110,21 £ =80,36 

Se pide determinar el indice de capacidad para importar. 

50. Un departamento de estadistica entrega los siguientes indices de comercio exterior: 


ANOS 

Base variable 

JC 

IVUX (2002 = 100) 

IVUM (2006 = 100) 

2006 

100,00 

124,35 

100,00 

2007 

110,12 

112,16 

104,36 

2008 

80,36 

118,14 

103,16 

2009 

120,14 

129,63 

106,81 

2010 

115,16 

132,35 

105,32 

2011 

126,84 

124,28 

108,14 



= Indice de quantum de exportacion 
IVUX = indice de valor unitario de exportacion 
IVUM = Indice de valor unitario de importacion 

Se pide calcular el indice de relacion precios de intercambio y la capacidad para importar con base 
2006. 


51. Con los siguientes datos: 


ANOS 

Indice valores unitarios 

INDICE QUANTUM 

DE EXPORTACION 
(2002 = 100 ) 

Exportacion (2002 = 100 ) 

Importacion (2002 = 100 ) 

2005 

183,12 

103,03 

105,22 

2006 

143,23 

108,62 

109,34 

2007 

126,56 

110,41 

107,38 

2008 

148,14 

106,28 

124,81 

2009 

137,48 

99,13 

112,07 

2010 

139,16 

108,64 

120,46 

2011 

160,52 

112,59 

123,14 


a) Calcular el indice de relacion de precios de intercambio (2005 = 100). 

b) Calcular el indice de capacidad para importar (2005 = 100). 


INDICES DE PRECIOS IMPLICITOS 

La mayoria de las variables economicas se expresan en valores denominados a precios corrientes, que 
corresponden al efecto combinado de cambios en los precios y en las cantidades reales. Asi mismo, 
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para determinar las modificaciones reales, se calculan los respectivos valores a precios constantes lo 
que implica aislar las variaciones en los precios. Este procedimiento requiere fijar los precios en un ano 
determinado y evolucionar el valor en dicho periodo por las variaciones en las cantidades (volumen) a 
traves del tiempo. 

De las dos valoraciones anteriores, no es posible separar los precios absolutos ni las cantidades 
absolutas, sin embargo al efectuar la division entre el valor a precios corrientes por los constantes de un 
periodo determinado, es posible descomponer sus variaciones de valor en cambios de precios y cantida¬ 
des. Esta es la funcion de los numeros indices, que para el presente caso se denomina ndice de precios 
Imp icitos al resultar cuantificado solo el factor precio en terminos relativos, con base en el periodo es- 
cogido en la serie a precios constantes. 

Veamos parte del procedimiento que se sigue para obtener el deflactor implicito del producto In¬ 
ferno ruto. 

Es necesario contar con la cantidad, precios y el valor de la produccion del ano que se investiga (n) 
y del ano inmediatamente anterior (n~ 1) a precios corrientes, con el fin de obtener el valor de la produc¬ 
cion a precios constantes del ano anterior. 

Se toma cada una de las cantidades (fisicas) de los productos del ano n y se multiplican por los 
precios unitarios del ano n - 1, asi se obtiene el valor de la produccion para cada uno de los productos 
involucrados en la muestra a precios constantes del ano anterior. Para ello se requiere de la siguiente 
informacion: 

Valor de la produccion del ano n (2011); Q^x P^ es decir, n x P n 

Valor de la produccion del ano n~ 1 (2010) Q n _ l x ^ n _ l es decir, Q 10 x P 10 



es decir, u xP 10 


Ahora, aplicamos el indice de aspe res (para volumen) y los indices de precios de Paasche (para 
precios) de acuerdo con la metodologia empleada, por algunos, en las cuentas nacionales. Estos indices, 
se calculan a nivel de cada sub-grupo. 


£ P £ P 

Indice de volumen =- - —— Indice de precios =--—— x 100 

y p y p 

^ 10 10 ^ 11 10 


Lo anterior se efectua cuando el proceso es normal, es decir, cuando las variaciones de los precios se 
ajustan a la realidad, ya que se cuenta con informacion sobre el IPC y el IPP y las diferencias entre ellos 
no deben ser muy grandes. En el caso de que se tenga desconfianza sobre la variacion presentada durante 
el periodo, se consulta el IPP y se hace evolucionar los precios del ano n — 1 en la misma proporcion en 
que se aumento el IPP; este seria el nuevo precio del producto que se esta analizando. 

Con los nuevos precios se consiguen las cantidades del ano n respetando siempre el a or , luego se 
prosiguen calculando los indices de precios y volumen. 


Ejemplo 13. Para explicar lo anterior, usamos valores arbitrarios de un producto, que se clasifica en 4 
subgrupos. 
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SUB-GRUPOS 

VALOR PRECIO- 2010 

CANTIDAD -2010 

PRECIO UNITARIO 

A 

2.392.338 

4.413.637 

542 

B 

3.528.972 

7.352.025 

480 

C 

13.681.533 

25.083.019 

545 

D 

2.875.359 

4.940.728 

582 

2 

22.478.202 

41.789.409 

2.149 


VALOR PRECIO 

1110 

VALOR PRECIO 

2011 

CANTIDAD 

2011 

PRECIO 

UNITARIO 

2.729.248 

3.139.254 

5.039.417 

623 

2.740.563 

3.787.173 

5.709.507 

663 

13.786.548 

18.216.593 

25.275.548 

721 

3.680.098 

4.951.689 

6.323.511 

783 

22.936.457 

30.094.709 

42.347.983 

2.790 


Para calcular los ndices de o umen , de precios y de a or utilizamos la information de la tabla 
anterior, siendo: 


Tabla 12.7 Simbolos y calculos de precios y valor 


2010 

2011 

Valor 

precio 

Cantidad 

Precio 

unitario 

Valor precio 
2011 2010 

Valor 

precio 

Cantidad 

Precio 

unitario 

p 

10 10 

22.470.202 

10 

^10 

p 

11 10 

22.936.457 

p 

30.094.709 

ii 

Pu 


Indice de volumen 


indice de precios 
indice de valor 


S 

11 

^.0 

S 

10 

p w 

X 

n 

Pn 

I 

n 

Py o 

I 

n 

**11 

X 

10 

Py o 


6 


6 


1 


1 


1 


= 1 


= 1 


= 1 


1 


Ahora, para obtener el Producto Interno ruto a precios constantes de un periodo determinado, se 
extrapolaron los valores del ano base (PIB a costo de factores y a precios de mercado), de cada sector 
economico, por los respectivos indices de cantidades, generalmente referidos al volumen fisico de pro- 
duccion, determinado mediante la aplicacion de los precios del ano base a las cantidades producidas en 
cada uno de los anos del periodo. En algunos sectores, es posible individualizar cada uno de los articulos 
producidos y determinar el valor de la produccion con respecto al periodo base; en otros no es posible 
(servicios), a estos se les aplican otros indicadores, como representativos de la variacion de la produc¬ 
cion bruta. Se tendran entonces deflactores de las exportaciones, de las importaciones, etc. 
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El Deflactor del PIB es el cuociente entre el PIB nominal (precios corrientes) de un deter- 
minado ano y el PIB real (precios constantes) de ese ano, indicando las variaciones que han 
experimentado los precios entre el ano base y el ano o anos que se investigan. 


Veamos el proceso para obtener el calculo deflactor impllcito del Producto Intemo Bruto; para ello 
consideremos que en un pais cualquiera se dispone del PIB a precios corrientes y constantes para los 
ultimos 6 anos y la base es 1995. 


Tabla 12.8 Calculo de indice deflactor del PIB 


ANOS 

PIB 

Precios corrientes 

PIB 

Precios constantes 95 

INDICE 

DEFLACTOR 

1995 =100 

INDICE 

DEFLACTOR 

2006 = 100 

% 

Variacion 

2006 

26.240.771 

950.694 

2.760,17 

100,00 

0 

2007 

33.064.150 

977.172 

3.383,66 

122,59 

+22,59 

2008 

40.058.610 

1.002.620 

3.995,39 

144,75 

+44,75 

2009 

49.352.520 

1.054.380 

4.680,71 

169,58 

+69,58 

2010 

69.720.830 

1.196.750 

5.825,85 

211,07 

+111,07 

2011 

82.465.310 

1.342.810 

6.141,25 

222,50 

+122,50 


ID,, 


26 2 0 771 
950 69 


100 = 2 760,17 


ID, 


6 1 
1 


1 


66 


ID, 


0 058 610 


100 


995, 


ID, 


9 52 520 


100 


680,71 


1 002 620 17 1 05 80 

Ahora procedemos a cambiar la base del Indice Deflactor de 1995 a la nueva base 2006. 

8 ,66 


ID = 2 760,17 10Q = 10Q 
6 2 760,17 

995 9 

m = ioo = l ,75 

08 2 760,17 


^07 = 


ID 09 = 


2 760,17 

680,71 
2 760,17 


100 = 122,59 

100 = 169,58, etc.. 


INDICE DE PRODUCTIVE)AD (IP) 


Corresponde a los cambios de eficiencia en la produccion, obtenidos mediante la relacion porcentual 
entre la produccion y los insumos. Generalmente se calcula un indiee de producti idad con un insumo: 
fuerza de trabajo, ya sea considerando el mero de personas ue aborano e\n mero de boras hombre 


I Prod = (Produccion +■ horas-hombre) 100 


I Prod = (Produccion +- numero de trabajadores) 100 


El Indice de produccion se refiere a los cambios que sufre la produccion, generalmente industrial, du¬ 
rante un periodo determinado, con respecto a otro periodo, considerado como base o punto de referenda. 
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Ejemplo 14. Con los datos que aparecen en el cuadro siguiente, se pide calcular el indice de produccion 
y de productividad. 


Tabla 12.9 Indice de produccion, obreros y productividad 


ANOS 

PRODUCCION 
(miles Tons.) 

NUMERO 

OBREROS 

INDICE 

2005 = 100 

INDICE DE 
PRODUCTIVIDAD 
2005 = 100 

Produccion 

Obreros 

2005 

350 

136 

100,00 

100,00 

100,00 

2006 

420 

136 

120,00 

100,00 

120,00 

2007 

580 

150 

165,71 

110,29 

150,25 

2008 

650 

152 

185,71 

111,76 

166,17 

2009 

810 

175 

231,43 

128,68 

179,85 

2010 

970 

175 

277,14 

128,68 

215,37 

2011 

1.150 

184 

328,57 

135,29 

242,86 


Indice de produccion = = 0,285761 

50 


Indice de obreros 


1 _ 
1 6 


ni =p ™ t = Too X 100 = 100 


X < 


50 = 100 
20 = 120,00 
580 = 165,71 etc 

1 6 = 1 
1 6 = 1 
1 =11 
1 =111 6 etc 


100 


Ills =P rarf =mQQx 100= 120,00 


100 

t o7 _ p _ 165,71 
md 110,29 


100 = 150,25 ete ... 


EJERCICIQS PARA RESOLVER 


w. 


La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


52. Los indices de produccion de un determinado bien de consumo, desde 2005 hasta 2011, fueron los 
siguientes: 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

Indice 

100,00 

112,83 

115,24 

110,12 

105,36 

110,92 

120,55 
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Sabiendo que en 2009 fueron producidas 300 T.m. de dicho bien, Hallar las cantidades producidas 
entre los anos 2005 y 2011. 

53. Con los siguientes datos, obtenga el indice de produccion y de productividad. 



*P = Produccion (miles de toneladas) * *PO = Promedio Obreros 

54. Con los siguientes datos (miles millones de pesos), se pide calcular la produccion industrial de un 
sector de la economia para los anos 2007 al 2011. 


ANOS 

PRODUCCION 
INDUSTRIAL 
(precios de 2009) 

INDICE DE PRODUCCION 
INDUSTRIAL 
(base 2007 = 100) 

2007 

5.000 

100,00 

2008 

- 

198,36 

2009 

- 

120,42 

2010 

- 

135,86 

2011 

- 

150,14 


INDICE PRECIOS DEL PRODUCTOR (IPP) 

Es un indice de gran importancia para economistas, empresarios y gobierno en general, ya que permite 
estudiar las variaciones generales en el nivel de precios, evaluar el desajuste entre la oferta y la demanda 
agregada y las relaciones entre los bienes individuales. Para ello, se toman los precios de un grupo de 
articulos que se venden en grandes cantidades en los mercados primarios, es decir, los precios pagados 
por el minorista, detallista o vendedor, al productor o mayorista. Indica, ademas, los cambios relativos 
de precios que los fabricantes pagan por la materia prima y por lo general, incluyen todos los principales 
productos que se utilizan en la industria. 

El IPP en nuestro pais es elaborado por el Banco de la Republica, el cual lo define como un 
indicador de a e o ucion de os precios en e primer cana de comercia i acion de os bienes 
transados en a economia. 

Anteriormente se le denominaba indice de precios al por mayor, y su ultima base fue 1970, con una 
cobertura de 14 ciudades y una muestra constituida por 540 articulos. Para el indice total se incluian los 
bienes producidos y consumidos en el pais, los importados y los exportados. A causa de las distorsiones 
que le fueron encontradas, a raiz de la bonanza cafetera, se suprimieron los bienes importados y exporta¬ 
dos. Otro de los inconvenientes que ocasionaba este indicador, era la inclusion en el universo de obser- 
vacion a productores y distribuidores mayoristas, lo cual originaba la presentacion de una gran variedad, 
con resultados de una diferencia acentuada en los componentes de los precios. 

Debido a la apertura de 1990, se generaron distorsiones en el indicador. Para evitar el multiple con- 
teo se establecieron 4 indices: bienes finales y consumidos naciona mente\ bienes finales importados; 
bienes oficiales ofrecidos internamente\ y demanda final (incluye exportados), adicionalmente se calcu- 
lan tres indices mas: E portados; de bienes destinados a a demanda intermedia (materias primas); y de 
oferta interna total (IPP con actuales ponderaciones). 

Dado que las cuentas nacionales tienen como nueva base 1994, se escogio este periodo como base, 
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para el calculo de las ponderaciones. Por su parte, el mes de comparacion de estos Indices es junio de 
2009 = 100. 

INDICE BURSATIL MUNDIAL DOW JONES 

El indice Bursatil Mundial Dow Jones esta formulado con el proposito de mostrar el rendimiento de diferentes 
industrias en las bolsas mundiales. El indice se basa en el precio de las acciones de 2.600 empresas que se 
cotizan en 26 bolsas. Las bolsas incluyen algunas importantes, como las de Nueva York, Tokio y Londres, 
asi como algunas mas pequenas, como las de Hong Kong, Estocolmo y Madrid. Hasta la fecha, la unica 
bolsa latinoamericana que se incluye en el indice es la de ciudad de Mexico. Para la creacion del indice se 
tradujo el precio de las acciones a 31 de diciembre de 1991 a una base de 100 puntos. El indice sube o baja 
a medida que el precio en bolsa de las acciones que lo integran sube o baja en dolares, a la tasa de cambio 
del dia. Este indice hace referencia a 9 grupos que tienen en total 30 sub-grupos. 


Materias basicas 

Consumo productos ciclicos 

Productos quimicos 

Publicidad 

Productos forestales 

Aerolineas 

Mineria 

Fabrica de autos 

Metales no ferrosos (todos) 

Construccion de viviendas 

Productos de papel 

Muebles y articulos para el hogar 

Metales preciosos 

Electronica de consumo 

Acero 

Ropa 

Consumo productos no ciclicos 

Industrials 

Alimentos 

Materiales de construccion 

Pesca 

Transporte maritimo 

Farmacia 

Tecnologia 

Tabaco 

Computadoras 

Energia 

Medicina y biotecnologia 

Carbon 

Semiconductores, etc. 

Petroleo 

Programas informaticos 

Finan as 

Servicios publicos 

Bancos (todos) 

Sistemas telefonicos 

Seguros (todos) 

Independientes 


Conglomerados 


Refleja la internacionalizacion de los precios y las industrias, aunque las condiciones locales pue- 
den afectar el precio de una accion en una empresa y una bolsa determinada. 

INDICADORES DE DESEMPLEO 

Para el calculo de las tasas sobre desemp eo , sub-emp eo y otros indicadores de la fuerza laboral , se 
requiere en primer lugar la realizacion de una investigacion denominada, en nuestro pais, Encuesta de 
hog ares. 

La encuesta de hogares cubria 14 de las principales ciudades. En 7 ciudades la encuesta se realiza 
trimestralmente, semestralmente en dos y anualmente en 5, para determinar los cambios globales en los 
niveles de empleo de la poblacion, a fin de suministrar la informacion basica necesaria para el diagnos- 
tico de la fuerza laboral. 
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Los principales indicadores de empleo que se calculan son los siguientes: 

a) Tasa de desempleo (TD). Se considera como la relacion porcentual entre el numero de 
personas desocupadas (D) y el numero de personas que integran la poblacion economicamente 
activa (PEA). 

_ TD = (D -r PEA) 100 _ 

D = Personas con edades de mas de 12 anos que no trabajaron, hicieron o no diligencias para 
conseguir trabajo, o se hallaban disponibles para trabajar durante la semana de referenda. 

PEA = Es el conjunto de personas may ores de 12 anos, de cualquier sexo, que durante la semana 
anterior a la encuesta, ejercieron o buscaron ejercer una ocupacion remunerada en la produccion 
de bienes y servicios, y aquellas que en su condicion de ayudantes familiares trabajaron sin 
remuneration en la empresa del respectivo jefe de familia o pariente, por lo menos durante 15 
horas semanales, de acuerdo con la definicion establecida por el DANE. 

b) Tasa de subempleo (TS), Es tambien una relacion porcentual de la poblacion que manifesto 
Querer y poder trabajar mas horas a la semana (PS) y el numero de personas que integran la 
poblacion economicamente activa (PEA). 

_ TD = (PS -T- PEA) 100 _ 

c) Tasa bruta de participation (TBP). Es el cuociente entre el numero de personas que 
componen la fuerza de trabajo (PEA) y el numero de personas que integran la poblacion total 
(PT). 

_ TBP = (PEA 4- PT) 100 _ 

d) Tasa global de participation (TCP). Es la relacion porcentual entre la poblacion 
economicamente activa (PEA) y el numero de personas que integran la poblacion en edad de 
trabajar (PET) (personas de doce anos y mas). 


TGP = (PEA -r- PET) 100 


OTROS INDICADORES (OI) 

Son numerosos los indicadores economicos, sociales etc., algunos de ellos conocidos como tasas, cuando 
la base con la cual se calcula es bastante grande. 

Tasa de natalidad (TN). La tasa bruta de natalidad de un area, es el numero de nacimientos realmente 
ocurridos durante un periodo de tiempo, dividido por la poblacion estimada de esa area, expresandose 
en terminos “por mil habitantes”. 

Tasa de fertilidad (TF). Numero de nacidos vivos en un periodo, expresado como proportion 
(generalmente por mil), de las mujeres potencialmente fertiles de la poblacion respectiva. 

Tasa de mortalidad (TM). Numero de muertes en un periodo, dividido por la poblacion expuesta a 
riesgo de muerte en ese periodo. 
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Tasa de incidencia (TI). Practicamente es una razon que se obtiene al dividir el numero de nuevos 
casos (de una enfermedad), por la poblacion sometida a riesgo en un periodo. 

Tasa negativa a responder (TNR). Proporcion de individuos que apesar de haber sido correctamente 
localizados, se niegan a responder. 

Otras tasas (OT). asa actuaria ; tasa de arrendamiento; tasa de cambio; tasa de captation] tasa de 
correction monetaria; tasa de interes (acti a o past a); tasa de redescuento; tasa dua de retorno; tasa 
preferential] tasa re a ; tasa de accidenta idad etc. 

Algo similar ocurre con los indices. 

Indice bursatil (IB). Evolucion temporal de las cotizaciones de los valores, en relacion con un valor 
tornado como base. 

Indice de bolsa. Es el numero relativo que indica diariamente la tendencia del mercado de las acciones 
inscritas y transcritas en dicha institucion. Las mas conocidas son: Dow Jones (bolsa de Nueva York); 
NIKKEY (bolsa de Tokio); FTSE 100 (bolsa de Londres); IGBC (bolsa de Colombia) y muchas mas, 
dado que cada pais tiene su propia bolsa para el mercado de sus acciones. 

Se podrian mencionar ligeramente algunos otros indices: de actividad por rotacion de inventarios; 
de actividad por velocidad de efectivo; de capital circulante; de rotacion de cartera; de rotacion de in- 
tereses; de rotacion de inventarios de productos en proceso; de rotation de obligaciones bancarias; de 
rotation de sobregiros ; de so encia ; de Morgan Stan e y otros mas, que no dejan de ser importantes 
como el indice de concentration de INI (1909); e indice de Pareto , etc. 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistemgf|^ ‘^femacion 
en Linea SIL. t su ) 

55. El valor de los activos para los ultimos 6 anos, de una compania, son: 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

Activos (miles): 

850.000 

1.000.700 

1.370.000 

1.720.600 

2.120.300 

2.850.320 


Se pide: a) Un indice que muestre como ha evolucionado el valor de los activos con respecto a. 
2006. b) Si para los mismos anos el indice deflactor (IPC) fue de: 575,1 732,6 954,3 1.250,3 

1.380,4 y 1.706,2 respectivamente. ^Los activos han crecido en terminos reales con respecto a 
2006? 

56. Una empresa espera aumentar los precios el ano proximo en un 25% i En que porcentaje deben 
aumentar las ventas para que el ingreso total sea de un 220% 

57. Se tienen dos series de indices (con diferente base) para el IPC 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

Indice 2002 = 100: 

428,6 

594,2 

672,4 




Indice 2008 = 100: 



100,0 

135,6 

162,8 

201,4 
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Si el salario promedio que pagaba una empresa en el 2006 era $746,400 y para 2011 paga un promedio 
salarial de $1,110,100; (a) La situacion laboral en la empresa mejoro en terminos reales en 2011 con 
respecto al 2006?; b) ual debe ser el salario promedio en 2011 para que sea igual al del 2006? 

58. Conteste brevemente los siguientes puntos: 

a) ^Cual es la importancia y finalidad de los numeros indices? 

b) iQu6 significa punto de referencia o periodo base? 

e) i En que consiste el indice de precios de Laspeyres? 

d) iQue entiende por indice de cantidad de Paasche? 

e) ^Para que se hace el empalme entre dos o mas series? 

f) ^En que consiste el encadenamiento? 

g) iQue es deflactar y como se realiza? 

59. Con las siguientes series de indices: a) deflactar la serie de inversion (miles millones de $) realizada 
por el gobierno en una determinada region del pais, tomando como referencia a 1999; b) /,Cual debe 
ser la inversion real para 2011 a precios de 2008?; e) ^Cual debe ser la inversion (nominal) en el 
2011, para que a precios reales sea igual a la de 2006? 


ANOS 

IPC 

1987 = 100 

IPC 

Base variable 

IPC 

2007 = 100 

INVERSION 
(miles mill ) 

1993 

285,3 



25 

1995 

336,4 



37 

1997 

520,6 



42 

1999 

720,6 



58 

2001 

810,4 

106,4 


65 

2003 


118,5 


80 

2005 


107,3 


105 

2006 


85,4 


115 

2008 


114,3 

116,4 

130 

2009 



137,3 

142 

2010 



155,4 

160 

2011 



176,8 

180 


60. Explique brevemente que nos indica cada uno de los siguientes indices: 

a) Indice de Dow Jones. d) Indice de Desvalorizacion. 

b) Indice de Precios del Productor. e) Indice de Devaluacion. 

c) Indice de Precios al Consumidor.. 

61. Una persona que en el 2009 tenia un sueldo de $450,000 y el actual de $ 1.068.000, el cual 
representa un aumento del 34% de su salario real. Teniendo en cuenta que el actual indice de precios 
al consumidor es de 350,62, se pide determinar el indice para el 2009. 

62. Comprobar los siguientes puntos: 

a) Si el tipo de cambio sube de $2,762,5 a $2.871,8, £se dice que la devaluacion ha sido, para ese 
periodo, del 4,25%? 

b) El indice de precios al consumidor sube en un 31%, £se considera que el Indice de poder 
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adquisitivo baja en un 24,6%? 

e ) Si la devaluacion entre dos periodos fue del 6,51%, siendo el tipo de cambio para el ultimo 
periodo de $2.376,8, ^cual fue el tipo de cambio para el periodo tornado como base? 

63. Una compania espera incrementar sus ventas en un 34% en el proximo ano. ^En que porcentaje 
debera incrementar el precio de venta para que el ingreso total se triplique? 

64. Los indices de precios al consumidor fueron del 307,13 y del 386,82 durante un cierto periodo. 

a) Si una familia presupuesta $95,000 mensuales para pagos en servicios (agua y luz) al comienzo de 
ese periodo, ^que cantidad deberia presupuestar para los mismos servicios al final del periodo? 

b) Suponga que el ingreso mensual familiar pasa de $720,000 a $800,000 durante ese periodo 
^Cual es el ingreso mensual real durante ese periodo? 

65. Considere el total de alumnos en su curso y determine las siguientes proporciones: 

a) Alumnos con promedio de calificacion superior a 3,6 

b) Alumnos que ven en TV el noticiero de las 7 p.m.. 

c) Alumnos que dejaron de asistir un dia de la semana. 

d) Alumnos que tengan mas de dos hermanos. 

e) Alumnos que midan mas de 1,55 centimetros. 

f) Mujeres en el curso. 

66. Calcular los porcentajes correspondientes con la informacion del punto anterior. 

67. Encontrar las proporciones y porcentajes en los siguientes casos: 

a) Alumnos de su curso que estan inscritos en algun equipo de futbol. 

b) Numero de ases en una baraja (naipes de 40 cartas). 

c) 10 alumnos ausentes en su curso. 

d) 5 votos favorables, en una eleccion realizada en su salon. 

68. Un comerciante vendio 15 neveras en el mes de abril. En el mes de mayo, con motivo de la 
celebracion del dia de la madre, vendio 60. ^Cual fue el porcentaje de: 

a) disminucion en las ventas en el mes de abril con relacion a mayo? 

b) aumento en las ventas en el mes de mayo con relacion a abril? 

69. ^Cual es el porcentaje de ganancia en un articulo que un comerciante compro en $15,000 y lo 
vendio en $18,200? 

70. En la vitrina de un almacen aparece al lado de un articulo un letrero que dice: “precio rebajado en 
un 200%”. Si el precio del articulo era $8,000 y su precio rebajado es $4,000; ^cual es el verdadero 
porcentaje de rebaja? 

71. Si un tendero vende un articulo en $3,500 y busca una ganancia del 25%, £en cuanto compro el 
articulo para luego venderlo por ese precio? 

72. Un fabricante vende 1.200 articulos en una semana. ^Cuantos articulos debera vender para obtener 
un incremento del 30%? 

73. Suponga que una fabrica tiene 1.200 empleados, de los cuales 400 son mujeres y se quiere saber 
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cual es: 

a) la proporcion de mujeres b) el porcentaje de hombres 

c) la relacion de mujeres a hombres d) la relacion de hombres a mujeres 

74. Cual es la proporcion de unidades defectuosas producidas por una maquina en un dia, si la produccion 
fue 7.500 unidades, de las cuales 320 fueron clasificadas como defectuosas? 

75. Investigue y establezca cuales han sido en su pais, para los ultimos 5 anos, las tasas de: 

a) Mortalidad b) Desempleo c) Nacimientos 

d) Participacion laboral e) Desercion escolar f) Analfabetismo 

76. Investigue como se obtiene y que significan las siguientes razones: 

a) de liquidez, de solvencia o corriente; 

b) de liquidez inmediata o prueba de fuego; 

e) de alta fluidez; 

d) de endeudamiento financiero; 

e) de accionistas propietarios; 

f) de rentabilidad del capital contable. 

77. Suponga que se dispone de cierta informacion por sexo, sobre personas portadoras de un irus 


SEXO 

ENFERMEDAD X 

TOTAL 

Portadores 

No portadores 

Hombre 

(a) 3.500 

(c) 

(n) 5.600.000 

Mujeres 

(b) 7.200 

(d) 

(m) 9.230.000 

Total 

(e) 10.700 

(0 

(k) 14.830.000 


De las siguientes relaciones, i cuales considera que son razones y proporciones? 


Nota: En el SIL Sistema de Informacion en Linea se incorporo un capitulo que debe ser consultado sobre Razones 
y Porcientos, titulado “Algunos elementos basicos de las matematicas Capitulo 14. 


1 


(a 


(a) {n) 

Je) Jk) 


{c 

V) 






10 


(e 

5 ) 
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Los numeros indices generalmente indican las variaciones o cambios que presenta una variable 
a traves del tiempo, por esta razon se constituyen en series de tiempo. Su importancia para ser 
usados continuamente y en numerosos casos, se debe a la posibilidad de establecer comparaciones 
con datos presentados en diferentes unidades de medidas, de ahi su uso en el campo economico 
donde prevalecen los estudios con unidades heterogeneas. 

Es una herramienta estadistica facil de manejar y entender, por esto varias entidades prefieren mos- 
trar la information en forma de porcentajes, en vez de suministrarla de manera diferente. Es mas 
simple el analisis del comportamiento de una serie cuando es expresado en terminos relativos. 

En el campo economico hay tantos indicadores que faltaria espacio para mencionarlos todos; 
algunos de estos indices son: los de costo de la construction pesada y de vivienda; de las ventas 
del comercio al por menor; demanda de la energia electrica; sacrificio de ganado; de la oferta mo- 
netaria; medios de pago; colocaciones del sistema fmanciero, etc. Pero no todos estan asociados 
al campo economico, sino que tambien son utilizados en campos muy variados, por ejemplo en 
la education, para calcular los indices de escolaridad, de retention, de mortalidad academica; en 
el campo de la salud, justicia, transporte, etc. 









CONTENIDO 


Series 


Terminos, definiciones, utilidad y 
aplicaciones. Conceptos generales. 


i 


“La ciencia es solo un ideal. La de hoy 
corrige la de ayer y la de manana la de hoy. 

os rtega y asset 


Componentes de una serie. 

Tendencia rectilinea, parabolica y 
exponencial. Calculos y graficacion. 

Metodo de los semi-promedios y 
Promedios moviles. 

Desestacionalizacion de una serie de 
tiempo. 


Sintesis de la Unidad. 


■ Ejercicios para Resolver, resueltos 

en el Sistema de Informacion en 
Linea SIL. 


C OMPETEN Cl AS 


El estudiante debera estar en capacidad de: 


□ Entender y manejar correctamente cada 
uno de los terminos que deberan ser 
utilizados. 


□ Conocer la importancia que tiene la 
Estadistica no solo como asignatura, 
sino en el ejercicio profesional. 

□ Realizar pequenas investigaciones 
estadisticas, aplicando los conocimientos 
recientemente adquiridos, en cada una 
de las etapas del proceso. 

□ Distinguir con claridad la diferencia 
entre una Monografia y una Encuesta, 
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GENERALIDADES 


Las series de tiempo tambien se les denomina series crono ogicas 

Datos atempora es: son aquellos que se obtienen de investigaciones aisladas, no periodicas, es de- 
cir, se producen una vez, dos veces, etc, pero no se vuelven a producir. 

Datos tempora es: son aquellos que se van registrando a medida que se van produciendo, en un 
estricto orden cronologico. En la vida diaria nos encontramos con mucha informacion de este tipo: na- 
cimientos, accidentes de transito o laborales, exportaciones e importaciones, ventas, presupuestos, etc. 

Una serie de tiempo o crono ogica es un conjunto de observaciones ordenadas respecto aunacarac- 
teristica cuantitativa de un fenomeno individual o colectivo, que se toman en diferentes periodos de tiempo 
(diario, semanal, mensual, etc...) 

Las series de tiempo como el analisis de regresion, corresponden a distribuciones bidimensiona es , 
o hi ariantes es decir, se trabaja y analizan conjuntamente dos variables, salvo que en este caso una de 
ellas corresponde al tiempo que podria considerarse como la variable independiente o explicativa, y que 
se simboliza por X o t; la otra variable es la que se va a estimar, ya sea dentro de la serie (interpolar) 
o su comportamiento futuro (extrapolar), simbolizado por Y, y puede corresponded como por ejemplo 
production e portaciones entas boras trabajadas, inversion, matricula, defunciones, nacimientos, 
mo imiento de carga etc. Se trata de una regresion unilateral, solo se podra estimar a Y en funcion de 
X pero no al contrario. 

Vale la pena mencionar que las proyecciones o la tendencia en el futuro, deben hacerse para perio¬ 
dos cortos de uno o dos anos, maximo cinco anos, bajo el supuesto de que las condiciones dadas en la 
serie van a seguir siendo iguales que en el presente; imposible que se mantenga en periodos largos, a fin 
de que no se produzcan diferencias entre lo esperado y su comportamiento real. 

COMPONENTES DE UNA SERIE TEMPORAL 


Los movimientos que presenta una serie de tiempo , son producidos por una variedad de factores de 
caracter economico, naturales o institucionales. El analisis de estas series consiste en descubrir y 
cuantificar dichas influencias, ya sean intemas o extemas, estableciendo la evolucion que han tenido y 
su comportamiento futuro. 

Generalmente, se han venido considerando cuatro posibles componentes: tendencia estaciona idad 
ariaciones tic icas y a eatorias, de los cuales alguno o todos pueden estar afectando la serie de tiempo. 

endencia Son aquellas variaciones suaves y constantes que se suceden en un periodo relativamen- 
te largo. El periodo debe ser largo como para establecer una linea de tendencia que sea significativa. 

ariaciones estaciona es Generalmente ligadas a las estaciones del ano, tambien corresponden a 
cambios periodicos que se repiten en lapsos de tiempo mas cortos, como por ejemplo el movimiento de 
pasajeros urbanos enun dia, consumo de energia, asistencia a cines, discotecas, etc. Se puede determinar 
cuando se inicia y termina el periodo de variacion. 





CAPfTULO ONCE 

SERIES CRONOLOGICAS 


521 


ariaciones tic icas Son fluctuaciones a largo plazo, mas o menos periodicas, que se repiten regu- 
larmente cada cierto numero de anos. Se refiere a las fluctuaciones ciclicas en la actividad economica 
(recuperacion - auge - declinacion - crisis). Es dificil reconocer la longitud del ciclo, ya que su periodo es 
bastante largo y dificil de precisar en algunos casos, alcanza hasta los 40 o mas anos, su longitud 

ariaciones a eatorias Son aquellos factores que se presentan en forma accidental siendo dificiles 
de predecir, tales como: huelgas, crisis politicas, inundaciones, sequias, etc. 

Algunos autores consideran que la variable Y es el resultado de la suma de dichos factores, de tal 
manera que: Y = T+VE+VC+VA ; para otros es el resultado del producto de los factores: Y = T x VE 
x VC x VA. Sin embargo, la variable Y puede ser considerada como el resultado de la combinacion de 
suma y producto de estos factores Y = T(VC+VE+ VA). 

La diferencia entre el mode o aditi oytimu tip icati o es que, en el primero los componentes se con¬ 
sideran como residuos y se expresan en las unidades originales; en el segundo, por lo general, la tendencia 
se expresa en unidades originales y los otros componentes en terminos porcentuales o relativos. 


TENDENCIA 


Movimiento a largo plazo de una serie ordenada cronologicamente, es el componente mas utilizado para 
realizar estimaciones. 

En el analisis de la tendencia , se considera importante iniciar con la graficacion, con el fin de determi- 
nar la linea que mejor representa a esa poligonal. Puede decirse, que no es posible obtener en ningun caso 
una comprobacion absoluta de la bondad de la adaptacion de una linea, pues solamente el juicio personal 
y la experiencia del estadistico, son los elementos que pueden ponerse en juego en la eleccion del mejor 
ajuste. 

Para la determinacion de la tendencia, es decir, la obtencion de una linea mas sencilla que la poligo¬ 
nal que nos permita estimar el comportamiento futuro, aplicaremos el metodo de los mmimos cuadrados 
con el objeto de cuantificar los parametros en la ecuacion correspondiente: recti mea parabo ica 
e ponencia o cualquier otra linea que consideremos representativa de la serie, o que mejor describa la 
tendencia. 

METODO ANALITICO 

Consiste en determinar la ecuacion matematica adecuada, que nos permita describir de la mejor forma 
posible la tendencia , a fin de poder obtener buenos estimativos. De ahi la importancia de graficar los 
datos originales, con la cual podemos visualizar, en la mayoria de los casos, la linea que nos va a 
describir la tendencia. 

Tendencia lineal 

Corresponde a la funcion mas utilizada en el analisis de la tendencia, especialmente cuando la serie es 
corta y cuando la variable presenta variaciones bastante fuertes. La ecuacion general se puede representar 
indistintamente por: 




522 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


Y=b +c 


Y=p 1X + P0 


Y- fiX + A 


Donde: 

Y = Es el a or estimado , ya sea que se haya hecho una interpolacion o una extrapolacion. 

b = P x = B Es la pendiente , que nos indica el crecimiento o decrecimiento por cada unidad de 
tiempo. Se conoce como coeficiente angular. 

C = = A Es la interseccion con la ordenada o eje de Y, en un piano cartesiano. Se conoce 

tambien como coeficiente de posicion. 

= Variable tiempo o ariab e independiente (dias, meses, anos, etc.). 

Para el calculo de los coeficientes b y c, se hace con un sistema de ecuaciones, operadas simultanea- 
mente por ejemplo, a traves el metodo de los minimos cuadrados. Veamoslo con un ejemplo: 

Ejemplo 1. Con la siguiente serie (continua e impar ), tomando como origen el primer periodo de la serie, 
estimar el valor Y para el ano 2015 

Solucion: 


X. 

1 

X. 

1 

x y. 

1 j 1 

0 

0 

0 

1 

1 

29 

2 

4 

72 

3 

9 

126 

4 

16 

224 

5 

25 

300 

6 

36 

402 

21 

91 

1.153 


ANOS 

i 

2005 

24 

2006 

29 

2007 

36 

2008 

42 

2009 

56 

2010 

60 

2011 

67 

I 

314 


Sistema de ecuaciones: 


{a) =bYp + nc 

ip) 'Lyj, =b'Lx)+c'Lx l 


Se reemplaza: 


(a) 

(b) 


1 

1 


lb + c 
lb + 1 c 


Aplicando algunos de los metodos conocidos de: igua acion , sustitucion o e iminacion, obtenemos 
los valores para y c. Utilizaremos el ultimo, para ello multiplicamos la ecuacion (a) por menos 3 y se le 
resta a la ecuacion (b). 

(b) 1 15 = 91 b + 21 c 

(a) -9 2 = -6 b - 21c 
211 = 28b 0 

Reemplazamos en la ecuacion (a): 


i 211 

b = -= 7,5 

28 


b = 7,54 


314 = 21 (7,54) + 7c 
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C = 22,24 


1 -21(7,5 ) 
7 


22,2 


Se tendra que la ecuacion de la recta sera: Y= 7,54 X + 22,24 

Si se va a estimar Y para el ano 2015, se tendra que el valor de = 2015 - 2005 = 10 (se tomo el 
ano 2015 por ser =0) 


De donde: Y ]5 = 7,54(10) + 22,24 = 97,64 

(7 = 97,61 trabajando con todos los decimales, usando la calculadora). 


Otro procedimiento de calculo. El procedimiento de calculo se puede agilizar, utilizando formulas 
que permiten obtener resultados en forma directa. 


b = » ~ (X*,)(X.V,) 

n'Lxf - (LX'J 
c= ly jJ 1 blx L 


7(115 )-(2l)( 1 ) ( 

7(91)-(21) 2 ’ 1 

C = 1 ~ 7 / (21) = 22,2 ( 


) 


) 


Varian a residual o no explicada (VR). Determina la dispersion o concentracion de aquellos puntos, 
que no quedan sobre la recta. Ya sabemos, como en la regresion, si la VR es cero, todos los puntos quedan 
sobre la recta estimada, lo que equivale a decir, que no hay ninguno fuera de ella y el coeficiente de 
correlacion es igualauno. 


Los simbolos utilizados son tantos, entre ellos: VR S 2 S 2 etc; asi como la presentacion de las 


formulas de calculo: 


1 ) 4 =- 


2 ) 


S yx 


I yj~ c'Ly, - b'Lx t y t 


3) 


5, v 

= .v, ( 

i-r ) 





Con los datos del Ejemplo 1, aplicaremos las anteriores formulas: 


ANOS 

i 

2005 

24 

2006 

29 

2007 

36 

2008 

42 

2009 

56 

2010 

60 

2011 

67 

X 

314 



(1) VR = 

(2) VR = 
() VR = 


26,8572 _ 0 

’ 8 

15 702 - 22,2 ( 1 ) - 7,5 (l 15 ) 
7 

2 0,98(1 - 0,98 ) = ,8 
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Nota: por considerar que son muestras pequenas, algunos, en vez de dividir por 7, lo hacen por 5, es 
decir trabajan con n - 2. Las diferencias que se observan en los resultados anteriores, se deben a los 
decimales que se omiten, pues hemos aproximado a dos decimales. 

La desviacion tipica residual. Lo mismo que se dijo en el calculo de la desviacion tlpica de la media, 
en la regresion lineal, debe obtenerse mediante la raiz cuadrada de la varianza residual. 


S yx ~ si ~~ 1 



LIMITES DE CONFIANZA 


El estimativo obtenido no se da como cifra exacta, es decir, el analista, espera que se cumpla laprediccion, 
lo cual es dificil que en la realidad suceda, aun cuando se haya utilizado la linea adecuada a la serie analizada. 
La anterior razon, indica la necesidad de hacer la estimation por intervalos, o sea fijando limites dentro de 
los cuales este el valor real, con una seguridad o confianza del 95% o cualquier otro porcentaje que 
establezca el analista; para ello se tendra que: 



YA 


inferior 


) 

) 


v=n— l= 6 
OC = 0,05 
t = 2,447 


7 = 97,6 ±2, 

15 


189 

7 -4=- = 97,6 ± 1,75 = 
a/7 


J97,6 +1,75=99, 9 
[97,6 -1,75 = 95,89 


De acuerdo con el comportamiento de la serie durante el periodo 2005- 2011, se considera que en 
el futuro no se alterara. Bajo estas condiciones se predice que en el 2015 el valor de Y (produccion miles 
tons, ventas (miles mill, de $), etc.) sera de 97,64, sin embargo, con una confianza el 95 % el valor espe- 
rado para ese ano estara entre 95,89 y 99,39, por lo tanto se tendra la posibilidad del 5% que no quede 
incluido dentro del intervalo. Como se vera enseguida, el coeficiente de correlation de 0,99, nos estara 
indicando que el metodo matematico lineal es muy bueno para esta proyeccion. 


Coeficiente de correlation. Nos indica la bondad del ajuste lineal que se ha hecho. Denominado 
tambien como coeficiente de corre acion de Pearson , donde: -1 < r < 1|; siendo positivo cuando la recta 
es ascendente y negativo cuando es descendente. 

La formula mas utilizada que aparece en la mayoria de los textos de estadistica es: 


v — 


# — 

V 




7(115 )-(2l)( 1 ) 177 _ Ann 

-<1 [ 7 ( 91 )-21 2 ] [ 7(15 702)- 1 2 ] V( 196 )( n 18 ) 


Si r se eleva al cuadrado, se denomina coeficiente de correlation al cuadrado o coeficiente de de¬ 
termination Estos coeficientes tambien se pueden calcular de la siguiente forma: 
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R = 1 - 


2 _ ^""1 


2 

1 

15 702 -7 

m 2 

y n 



r = 


2 0,98 (Varianzadey) 


Recordemos que: 0 < 7? 2 < 1 y -1 < r < 1 

Otro procedimiento para el calculo de la tendencia lineal. En el Ejemplo 1, se considero como 
origen, el primer ano de la serie, siendo X l = 0. 

Sin embargo, cualquier periodo de la serie, se puede tomar como origen siendo lo mas practico en 
una serie continua e impar , ubicarlo en el centro de la serie, donde X 1 = 0 y con ello agilizaremos, sim- 
plificando las operaciones. Veamoslo: 

Ejemplo 2. 


ANOS 

i 

2005 

24 

2006 

29 

2007 

36 

2008 

42 

2009 

56 

2010 

60 

2011 

67 

X 

314 



2 

i i 

2 

i 

-3 

9 

-72 

576 

-2 

4 

-58 

841 

-1 

1 

-36 

1.296 

0 

0 

-166/377 

1.764 

1 

1 

56 

3.136 

2 

4 

120 

3.600 

3 

9 

201 

4.489 

0 

28 

211 

15.702 



c = 




n 


b = 


c = 


Y l5 = 7,54 4- 44,86 => 
( = 2015 - 2008 = 7) 


-= 7,5 (Exactamente igual al resultado dado en el Ejemplo 1) 



Y l5 = 7,54 (7)+ 44,86 =97,64 


Asi como este y los demas resultados obtenidos con el ejemplo 2, seran exactamente iguales a los del 
ejemplo 1, solo cambian los valores de algunas sumatorias. 


Ahora, observemos una serie continua con n mero par de periodos En primer lugar, diremos que 
hay datos anuales que no se pueden presentar como la suma de valores mensuales, sino como el promedio 
mensual, que a su vez es anual, como por ejemplo, el precio de un articulo en cuatro meses diferentes en un 
ano, siendo $ 5.000, $ 8.000, $ 6.000 y $ 10.000 respectivamente; en este caso el valor promedio mensual 
es de $ 7.250, al mismo tiempo es el promedio del valor del articulo para ese ano. 
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Ejemplo 3. 


ANOS 

i 

2004 

56 

2005 

42 

2006 

70 

2007 

82 

2008 

41 

2009 

63 

2010 

110 

2011 

84 

2 

548 


i 

2 

i i 

2 

i 

-1 

49 

-392 

3.136 

-5 

25 

-210 

1.764 

-3 

9 

-210 

4.900 

-1 

1 

-82 

6.724 

1 

1 

41 

1.681 

3 

9 

189 

3.969 

5 

25 

550 

12.100 

7 

49 

588 

7.056 

0 

168 

474 

41.330 


b = — =2,82 Y= 2,82x + 68,5 

168 

c= —= 68,5 f 13 = 2,82 (11)+ 68,5 = 99,52 

8 

En el cuadro anterior, en la columna de se puede observar que hay dos periodos en el centro de la 
serie 2007 y 2008, suponiendo que la informacion esta dada al primero de julio en cada uno de los anos, 
se tendra que en el primero de enero de 2008, estara localizado el origen donde = 0, y como toda infor¬ 
macion anual supuestamente estara dada al primero de julio, se tendra para el 2008 un semestre y como 
cada ano tiene dos semestres, se ira contando de dos en dos, asi para el 2009 =^> = 3; 2010 =5y 

asi sucesivamente. Hacia arriba sera lo mismo pero con signo negativo. 


y, 

ix 2 




El valor de en la ecuacion se calculara asi: = 2013 - 2008 = 5 anos x 2 = 10 semestres, luego 
se tendra que =10+1 = 11 semestres. El + 1 se debe al primer semestre de 2008. Procedamos de otra 
manera: =2013-2011 = 2 anos x 2 = 4 semestres + 7, que aparece en el 2011 = 11 semestres. Como 

en el caso anterior, calcularemos la arian a residua y el error estandar asi: 


2 _ £y, -cZy, -bly,x t 
V “ „ 


s 2 - 


1 0-68,5(5 8)-2,82 ( 7 ) 


= 06,92 


s'w = s l (l - r2 ) s yx = 7 (l-0,59 8 2 )= 06,8 , dejamos que el estudiante aplique la formula 


S„ X =VR = 

JP 




y compare los resultados, los cuales deberan ser aproximadamente iguales. 


Ahora obtenemos la desviacion tipica residual: s yx = 06,8 = 17,52 

Los limites de confianza del 95%, seran: 

17,52 


Y ± t -j= 
V n 


99,52 ± 2, 7 


v =n- 2 = 6 y oc= 0,05 


t = 2,447 


546 = {sV 


68 

6 


99,52 ± 15,1 

v =n -l =1 y oc= 0,05 


t = 2,365 


Representacion grafica 

Se le dan dos valores a . en la ecuacion, por ejemplo: cuando = - 3 y = 5, los resultados seran 
para esos valores Y= 60,03 y Y = 82,61 respectivamente; tomamos un cuadrante, colocando en el 
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eje horizontal (abscisa) los anos y en 
el eje vertical (ordenada) la variable Y. 
Establecemos los dos puntos de Y de 
60,03 para 2006 y de 82,61 para 2010. 
Estos dos puntos los unimos y nos 
dara la recta que deseamos representar. 
Ademas, el coeficiente de correlacion 
obtenido enelejercicioesde R 2 = 0,35 y 
r = 0,59, lo cual nos indica que el ajuste 
rectilineo no es el mas indicado para 
esta serie, ya que ella se confecciono 
con el a fin de mostrar variaciones 
grandes durante el periodo investigado. 


y, 



- 1 - 1 - 1 - 1 - 1 - 1 - 1 - Y 

04 05 06 07 08 09 10 11 

ANOS 


T* — 

nLx,y t 

j 



8(7 ) 

V [8(l68)][s( 1 0)-(5 S) 2 ] 


= 0,59 


APLICACION DEL PROGRAMA EXCEL EN SERIES 

DE TIEMPO O SERIES CRONOLOGICAS 



Ejemplo 3. Supongamos que hemos digitado en una hoja de calculo, informacion acerca de la variable 
( ), durante un periodo de 10 anos ( ). 


Figura No. 1. Informacion en la Hoja de Calculo. 
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En la SEGUNDA PARTE DEL SIL encontrara en conjunto toda la aplicacion del EXCEL a la ESTADISTICA, ofreciendo una 
BASE DE DATOS para practicar. 
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Las VENTAS corresponden a la variable Y, la cual vamos a proyectar, es decir, estimar su comportamiento 
futuro. Esta variable esta dada en miles de millones de pesos y su rango sera B2:B11. Se desea realizar 
la estimacion de las ventas para el ano 2013, asi: 

r*-\ 

□ Seleccionamos una celda como RANGO DE SALIDA, supongamos que el resultado de Y u 
debera aparecer en la celda B13. 


□ Hacemos CLIC en la funcion fx. En el cuadro de dialogo que aparece seleccionamos la opcion 
PRONOSTICO y luego CLIC en ACEPTAR. 


Figura No. 2. Insertar Funcion. 
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PRONOSTICO(x;conocido_y;conocido_x) 

Calcula o predice un valor futuro en una tendencia lineal usando valores existentes. 


Ayuda sobre esta funcion 


~m~| Hojal, Hoja2 , Hoja3 , Q 
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Modificar | 


APLICATIVOS EN 


^J^IQLibroEst^ 


□ Microsoft Excel - L... 


| ^AP728-Paint 


ES 18:00 


Observemos que en el nuevo cuadro de dialogo PRONOSTICO, aparecen tres casillas las cuales 
debemos teclear de la siguiente forma: 


□ El campo X, corresponde a los anos que se han establecido para el PRONOSTICO. Contando 
a partir del ano 2002 y teniendo en cuenta que nuestro pronostico lo establecimos para el 2013, 
X corresponde a la cantidad de anos que transcurren desde el 2002 hasta el 2013, es decir, X 
tomaria un valor de 12. 

□ En el segundo campo correspondiente a CONOCIDO Y, seleccionamos el rango de datos, 
B2:B11. 

□ En el tercer campo CONOCIDO X, seleccionamos el rango de datos C2:C11. 

□ Finalmente hacemos CLIC en ACEPTAR. 
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Figura No. 3. Argumentos de la Funcion. 
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Resultado de la formula = 104,3818182 

Ayuda sobre esta funcion 
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Observemos que el resultado pronosticado para las ventas del ano 2013 seran de 104.38 
millones. 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 



1. Con los siguientes datos se pide: 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

Produccion: 

360 

383 

337 

390 

406 

459 

480 


a) Estimar la produccion (Miles Tons) para el 2024 ajustando una recta (tomando como origen al 2005). 

b) Estimar la produccion (Miles Tons) para el 2009 ajustando una recta (trabajar con cambio de origen). 

c) Estimar el mismo ano y utilizar el mismo sistema del punto (b) pero agregando a la serie el ano 
2012 = 600. 

(Nota: El cambio de origen, consiste en trasladarlo al centro de la serie) 

2. Con los datos del ejercicio 1 y los resultados de (b), se pide: 

a) Fijar limites de confianza del 95 %, para Y\g 

b) Calcular el coeficiente de correlacion de Pearson. 
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3. Con los indices de precios anuales, se pide: 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

Promedios: 

128 

135 

148 

145 

152 

161 

162 


a) Estimar el precio promedio para el 2013. 

b) Obtener el error estandar de estimacion y fijar limites de confianza del 95 %. 

c) Calcular el coeficiente de correlacion. 


4. Se dan los siguientes datos: 


Sepide: 

a) Estimar el valor de Y para el ano 2020 mediante un ajuste 
rectilineo. 

b) Calcular el valor de x y 2 . 



5. De acuerdo con los siguientes datos. 

Sepide: 

a) 

b) 


6. Se conocen los siguientes datos: 



Se sabe adicionalmente que la media de las observaciones es 280. Se pide reconstruir el cuadro anterior, 
ademas estimar el valor de Y para el ano 2018. 


Estimar el valor de Y para el ano 2021 mediante un ajuste 
rectilineo. 

Calcular el valor de 2 y 4 



7. Con los siguientes datos, sobre valores de las ventas en Miles Mill. $ 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

i’ 

42 

64 

82 

110 

96 

84 

124 


Se pide: 

a) Estimar 2007 y 2013. 

b) Calcular el coeficiente de correlacion. 
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8. Con los siguientes datos se pide: 


ANOS: 

1991 

1995 

1999 

2003 

2007 

2011 

Produccion: 

12 

30 

89 

114 

140 

200 


Mediante un ajuste rectilmeo trabajando con cambio de origen, estimar la produccion (miles Tons.) para 
1993 y2016. 


9. El volumen de ventas que anualmente se hace en unos grandes almacenes desde 2000 hasta 2011, 
presenta una tendencia creciente segun la ecuacion. 

7=0,11 +1,52 /? 2 = 0,87 

Siendo 7 el volumen de ventas (en millones) y la variable tiempo con origen en el punto medio entre 
2000 y 2011 (unidad temporal: medio ano). Se pide estimar el volumen de ventas para el 2018 y 2021 

10. /,Puede aceptarse la recta de tendencia secular 7 = 2 +35 R 2 = 0,99 ( = 0 en 2006; unidad 

temporal: medio ano) para predecir la produccion de un bien para el ano 2021? 

11. La variable 7toma para cada unidad de tiempo, los siguientes valores: 10,12,13, 15, 20. Calcular el 
incremento medio de la variable 7 por unidad de tiempo. 

12. Se sabe que el desarrollo de la variable 7en el tiempo, tiene una tendencia lineal, pero de ella tan solo 
se conocen los siguientes valores: 


ANOS: 

2001 

2002 2003 2004 

2005 

2006 2007 2008 

2009 2010 

2011 

i 

8 

16 

14 

20 

22 

22 


Se puede estimar los valores desconocidos. 


13. Con la siguiente informacion sobre el valor de las exportaciones, en millones de pesos, durante 
varios anos: 

Z . = 0 E = 1.620 E 2 = 314.502 

i i i 

E ? = 60 E . =1.148 =~2, ene 2005 

i ii 7 

Se pide: 

a) Estimar el valor de las exportaciones en millones de pesos para el 2017, fijando limites de 
confianza del 95 %. 

b) Determinar el coeficiente de correlacion lineal. 

14. Siendo: 

E . = 0 E = 2.032 E 2 = 509.992 

i i i 

E 2 = 60 E . . = 1.723 n = 9 

i i i 

El ano base de la serie es 2008. Se pide: 

a) Calcular el coeficiente de correlacion lineal 

b) Estimar el valor de 7para el 2015. 

15. Los gastos personales (miles de millones de pesos) durante varios anos, en una region cualquiera, 
fueron los siguientes: 









532 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


ANOS: 

2007 

2008 

2009 

2010 

2011 

Gastos personales: 

230 

285 

310 

325 

360 


Se pide: 

a) Ajustar una recta, por el metodo de los minimos cuadrados, determinando en que ano los gastos 
personales alcanzan los $602 miles de millones. 

b) Estimar los gastos personales para el mes de septiembre de 2015. 

16. Los gastos (cientos millones de pesos) de una Oficina Publica durante el periodo 2007-2011 
fueron: 


ANOS: 

2007 

2008 

2009 

2010 

2011 

Gastos personales: 

100 

150 

200 

200 

250 


a) Supuesta una tendencia lineal; estime los gastos de la oficina para 2013. 

b) Calcule el valor de r. 


17. Se hizo una encuesta en Bogota sobre las ventas de carros usados, en la decada 2002 - 2011. Se 
ajusto una curva de tendencia para las ventas de cada ano, obteniendose la siguiente ecuacion: 

Y= 900 + 40 Donde = 0 para el primero de enero de 2007. 

(Si consideramos que esta medida en unidades semestrales). Se pide predecir las ventas anuales 
para 2013. 

18. Se ajusto una recta de tendencia, para los egresados de la facultad de Economia de esta universidad, 
durante seis anos 2006 - 2011; por el metodo de los mmimos cuadrados. 

a) La ecuacion mostro que en2006 el salario seriade $896,000 y de $ 1‘692.000 en 2011; encontrar 
la ecuacion con origen en 2007 y estimar el promedio mensual de salario para los egresados en 
el 2013. 

19. Con la siguiente informacion sobre el valor (millones de pesos) de las exportaciones. 

2 . =0 E =244 E . .= 233 E 2 = 8.118 n = 9 E 2 = 60 

ii iii i 

■ Donde = -2 se refiere al ano 2005. 

Se pide: 

a) Estimar el valor (millones de pesos) de las exportaciones para el 2015, estableciendo limites de confianza 
del 95 %. 

b) Hacer las anteriores estimaciones, trabajando con cambio de origen y calcular el coeficiente de 
correlacion lineal.. 

20. Las ventas anuales (miles millones de pesos) desde 2002 hasta 2011 arrojan la siguiente 
informacion: 

E =45 E .= 544 E 2 = 285 E . =3.266 E 2 = 38.040 

i i i ii i 

a) Grafique la linea correspondiente a Y . 

b) Determine el coeficiente de correlacion lineal. 
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21. Los pasajeros del interior del pais llegados por via aerea a la capital, durante 6 anoshan sido. 

Suponiendo que la serie se ajusta a una recta 

a) /,Cual es el numero de pasajeros, por via aerea, esperados para el 
2016y2021? 

b) Calcule el coeficiente de correlacion. 

c) Fije los limites de confianza del 95% para los estimados del 
punto a). 


ANOS 

PASAJEROS 

2006 

723.000 

2007 

982.500 

2008 

1.236.420 

2009 

1.450.600 

2010 

1.636.250 

2011 

1.890.900 


22. Los turistas extranjeros llegados a una ciudad X han sido, en los ultimos cinco anos: 


Se ha determinado que el 60 % de estos turistas requieren alojamiento 
en establecimientos hoteleros y que el 40 % requieren alojamiento en 
hoteles de cinco estrellas. 

a) Determinar la demanda total de alojamiento en el 2017. 

b) La demanda de alojamiento para hoteles de cinco estrellas en el 
2017. 


23. Los gastos de una empresa durante 6 anos fueron: 


Sepide: 

a) Ajustar una recta por el metodo de los mmimos cuadrados, para 
estimar v 

b) Calcular el coeficiente de correlacion. 


ANOS 

GASTOS 

2006 

2.460 

2007 

2.700 

2008 

2.850 

2009 

2.950 

2010 

3.150 

2011 

3.300 


ANOS 

PASAJEROS 

2007 

417.500 

2008 

572.800 

2009 

620.350 

2010 

679.260 

2011 

712.800 


ANOS: 

1987 

1991 

1995 

1999 

2003 

2007 

2011 

i' 

120 

180 

100 

260 

370 

250 

460 


Estimar el valor de Y para el 2015, tomando como origen 1987. 

25. Resolver el ejercicio anterior trabajando con cambio de origen de tal manera, que I ■ = 0. 

26. Calcule el coeficiente de correlacion de Pearson, con los datos del ejercicio 25. 


Estimaciones mensuales con base en datos anuales 

Anteriormente se trabajo con periodos anuales, pero esto no impide que la serie corresponda a valores 
semanales, mensuales, trimestrales o informacion para cada 2 o 3 anos, etc., de todas maneras el proceso 
sera exactamente igual, con la diferencia de que X corresponded a dias, semanas, meses, trimestres, 
semestres, etc. 
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Ahora consideraremos el caso donde se tenga una serie con informaciones anuales y que sea ne- 
cesario hacer estimaciones mensuales; es posible realizarlo siempre y cuando se siga el procedimiento 
adecuado, de la siguiente manera: 


A1 estimar valores mensuales con base en datos anuales, hay que considerar dos situacio- 
nes: 

a) Datos anuales correspondientes apromedios de valores mensuales (ejemplo tipico: 
precios). 

b) Datos anuales correspondientes a suma de valores mensuales (ejemplo: produccion). 


El procedimiento a seguir en la estimacion de valores mensuales, con base en datos anuales median- 
te el ajuste rectilineo, se indica a continuacion: 



Utilizaremos los ejemplos desarrollados anteriormente, correspondiente a series continuas par e 
impar, ya sea con cambio de origen (X . = 0) o cuando es diferente a cero (X . ± 0). 

Ejemplo 4. Consideremos la serie 2005 -2011 del Ejemplo 1, para estimar los meses de septiembre/08; 
febrero/12, siendo 7 la variable produccion. 

Solution 

Se obtuvo la ecuacion Y = 7,54 4- 22,2 para realizar estimaciones anuales. De acuerdo a la tabla 

anterior, transformamos la ecuacion para realizar estimaciones mensuales: 


II 

jo* 

-)+ + 


ii 

1 V 1 

J 1 


1 


Y = -— X+—^ — => Y= X+l 

Si le damos a un valor de cero, se tendra 7= 1,853 para el 1° de Julio de 2005, pero la informacion 
se debe dar al 15 de cada mes; una forma seria: 7 = 0,052 (0,5) + 1,853 = 1,9055 y asi para todos los 
meses que se van a estimar, pero es mejor acondicionar la ecuacion al quince de cada mes, agregandole 
al coeficiente de posicion, la mitad (1/2 mes) del coeficiente angular. 

7=0,052 + 1,9055 —> 15 de julio de 2007. 

Ahora se tiene que Julio —> =0 Agosto —> =1 Sep/05 —> =2 Sep/06 —> =14 

Sep/07 -> =26 y Sep/08 -> =38 

^ sep/os = 0,052 (38) +1,9055 = 3,8815 es el estimado de la produccion (miles tons.) 





















CAPfTULO ONCE 

SERIES CRONOLOGICAS 


535 


Para la estimacion de Feb/12 se tiene que Sep/05 -> = 2 Oct/05 —> =3 Nov/05 -> = 4 

Dic/05 -> =5 Enero/06 -> = 6 Febrero/06-> = 7, de aqui contamos de 12 en 12, numero de 

meses por ano: Feb/07 -> =19 Feb/08 =31 Feb/09 -> =43 Feb/10 -> =55 Feb/11 

= 67 y Feb/12 -> = 79. 

Y F e b/i2 = 0,052 ( 79 ) + 1 ,879 = 5,987 

Ejemplo 5. Consideremos la ecuacion obtenida, trabajando con los datos del ejemplo 2. Cuando la variable es 
considerada como production y luego como precios : 

50 ucion Ecuacion para anos: Y = 7,54 + 44,86 

Produccion - estimacion mensual: f = + 44$6 => f = 0,052 + 3,738 

144 12 

Cuando = 0, se tendra Y= 3,738 al 1° de julio/08 y al 15 de julio sera: Y= 0,052 + 3,764 
A1 estimar Sep/08 se tendra para agosto/08 —> =1; sep/08 —> =2. 

f Sep /08 = 0,052(2) + 3,764 = 3,868 (miles Tons.) 

^Feb /12 = 0,052(43) + 3,764 = 6,00 (miles de Tons.) se estima para feb/12. 

51 usted estima Y n = 7,54(4) + 44,86 = 75,02 (Miles Tons.) y luego con la ecuacion para estima- 
ciones mensuales Y= 0,052x + 3,764, se obtienen los valores para los doce meses (Enero, Feb....Die) 
correspondiente al ano 2012 y esos resultados los sumamos, debe dar aproximadamente 75,02 (miles 
Tons.), por lo tanto: 


mensuales anual 

En el caso de trabajar con la variable precios, se tendra f = 7,54 + 44,86 para estimaciones con 

anos. Para estimativos mensuales seria: 

Y= + 44,86 -*Y= 0,6283 + 44,86 Cuando =0^ 7=44,86 

Corresponde al precio (promedio) para el primero de julio del 2008; se traslada al 15 de cada mes, sien- 
do Y= 0,6283 + 45,1742. Se le suma a C la mitad de b. 

Ejemplo 6. Consideremos el ejemplo 3, donde Y= 2,82 + 68,5 para realizar estimativos anuales. 

La ecuacion para estimar meses, suponiendo que la variable Y representa precios sera: 

Y = —— x + 6 , =^> Y- , Jt+6 , si =0 
6 

se tendra que Y= 68,5 al primero de enero de 2008, si lo trasladamos al 15 de enero, la ecuacion sera 
Y= 0,47 + 68,735, en ese punto = 0 y desde ahi contamos los meses necesarios para la estimacion 
respectiva. 


Y =-x+c 
6 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

27. Con los resultados obtenidos en el ejercicio 1, se pide: estimar la produccion en los meses de Mayo 
de 2006; Septiembre de 2008; Octubre de 2010 y Diciembre de 2014. Se toma la ecuacion cuyo 
origen es el ano 2000, siendo ( =0). 

28. Con los datos y resultados del ejercicio 3, calcular los indices mensuales de precios (de Enero a 
Diciembre) para el 2009. 

29. Con los datos del ejercicio 8, se pide estimar los meses de Marzo de 1996 y Abril de 2005. Recuerde 
que se trabajo con cambio de origen, es decir, cuando: £ . = 0 

30. Con los datos del ejercicio 14, se pide estimar los meses de Mayo de 2006; Octubre de 2012, 
suponiendo que la variable corresponde a la suma de valores mensuales (Produccion). 

31. Con los datos del ejercicio 16; estimar los gastos de la oficina para Agosto de 2013. 

32. Con los datos del ejercicio 20, estimar las ventas de Septiembre de 2009 y Octubre/2011 y 2013. 



METODO DE LOS SEMIPROMEDIOS 

Este metodo, utilizado para determinar la tendencia no es muy recomendable, sin embargo se emplea 
cuando se requiere agilizar los calculos y tener una aproximacion al logrado a traves de los minimos 
cuadrados. 

Consiste en dividir la serie en dos partes, en tal forma que cada una de ellas tenga un numero impar 
de periodos. En algunos casos, pueden sobrar periodos, por lo tanto deberan ser localizados en la parte 
inicial de la serie o en el centro de la misma. 


Ejemplo 7. Regresemos al Ejemplo 1 y realicemos la estimacion para el 2015. 
Solution: 


Semi 

Semi 

Y; 

suma 

promedio 



— = 6 

6 

1 

- -— =61 

61 


ANOS 

i 

2005 

24 

2006 

29 

2007 

36 

2008 

42 

2009 

56 

2010 

60 

2011 

67 
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Y ~Y 

h = _ -A _ 111 _ 

0 2010-2006 


b = 


61-6 


1° Metodo 


Y= 7,8325 + 29,67 =>7 15 = 7,8325 (9)+ 29,67 =100,16 

a) =2.015-2.006 = 9 

b) Y= 7,8325x + 61,0 =>y i5 = 7,8325(5)+ 61,0 = 100,16 

= 2.015 + 2010 = 5 

Los resultados son exactamente iguales. 

2° Metodo 


Si 2005 —► = 0 , para el 2006 —> = 1 y en el 2010 —> =5 por lo tanto se tendran dos 

ecuaciones, sabiendo que Y=b c. 

61= 5 b + c Despejamos: 

(1) 61 = 5 b + c - 29,67 =-l b-c 1 

(2) 29,67 = \b + c j^ = b 0 ^ b= = 7 ’ 8 25 

Reemplazamos en una de las ecuaciones 29,67 = 1(7,8325) + C donde C = 29,67 - 7,8325 = 
21,8375. La ecuacion, con = 0 en el 2005 sera: f ]5 = 7,8325(10)+ 21,8375. = 100,16 (Tambien 
por este procedimiento se obtiene el mismo resultado) 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 



33. Con los siguientes datos, estimar 7 lg , utilizando el metodo de los semi-promedios. 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

i’ 

200 

360 

490 

500 

620 

780 

910 


34. Con los siguientes datos: 


ANOS: 

1999 

2001 

2003 

2005 

2007 

2009 

2011 


60 

140 

400 

600 

800 

900 

1.000 


Se pide: 

a) Por el metodo de los semi-promedios, estimar el valor de Y para el 2007, mediante una recta. 

b) Con la anterior ecuacion estimar los preciosen los mesesde Mayo 1998, Junio 2008. 


35. Con los indices de precios anuales se pide: 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 


1.280 

1.350 

1.480 

1.450 

1.520 

1.610 

1.620 


Trabajar utilizando el metodo de los semi-promedios para estimar el 2017. 
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36. Un almacen consolida sus ventas en periodos trimestrales. 


ANOS 

TRIMESTRES 

VENTAS 
(mill. ) 


I 

810 


II 

1.200 

2009 

III 

860 


IV 

1.680 


ANOS 

TRIMESTRES 

VENTAS 

(mill. ) 


ANOS 

TRIMESTRES 

VENTAS 
(mill. ) 


I 

900 



I 

860 


II 

1.300 



II 

1.100 

2010 




2011 




III 

850 



III 

940 


IV 

1.600 



IV 

1.400 


a) Representar graficamente la anterior informacion. 

b) Utilizando el metodo de los semi-promedios, estime el 2° semestre de 2013. 

c) Con la ecuacion anterior, dibuje la linea de tendencia lineal para estos datos. 


ANOS: 

1996 

1999 

2002 

2005 

2008 

2011 


200 

360 

460 

580 

720 

800 


Con la serie 1996-2011 se pide: 

a) Mediante un ajuste parabolico, trabajando con cambio de origen ( £ . = 0 ), estimar Y para el 
2013. 


b) Trabajando con el metodo de los semi-promedios, estimar a Y para el 2015. 

38. Utilizando la siguiente serie, se pide estimar el valor de Y para el ano 2015, mediante el metodo 
de los semi-promedios. 


ANOS: 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

i 

200 

380 

520 

600 

640 

720 

580 

660 

940 

800 


TENDENCIA O SUAVIZACION MEDIANTE PROMEDIOS MOVILES 

Los tota es y promedios mo i es permiten, en primer lugar, eliminar dos de los cuatro componentes que 
tiene la variable Y , estos son: las ariaciones estaciona es y los a eatorios, sin embargo con frecuencia 
son utilizados como una aproximacion a la tendencia de una variable temporal, permitiendo realizar 
estimaciones. Tambien permite estimar la variacion que esta experimentando la serie, comparando un 
promedio movil con otro del mismo periodo o periodos diferentes. 

Este metodo fue sugerido por Thomson en 1947, considerado valido cuando la distribucion de las 
tolerancias es simetrica. Algunos lo consideran comoun metodo mecanico, generalmente utilizado para sua- 
vizar las irregularidades y fluctuaciones de una serie temporal. 

Los totales y promedios moviles se pueden calcular utilizando un n mero impar de periodos: de 3 
en 3; de 5 en 5; de 7 en 7; y asi sucesivamente, o tambien un n mero par de periodos: de 2 en 2; de 4 en 
4; de 6 en 6; y asi sucesivamente. 

Ejemplo 1. Con los siguientes datos calcular los totales y promedios moviles de “3 en 3” y de “5 en 5”. 
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So ucion: 



Como se puede observar en la tabla anterior, consiste en tomar cierto numero de periodos (impar 
o par) de tres, cinco, siete o dos, cuatro, seis, ocho, etc., que comprendan observaciones consecutivas, 
las que se suman y se dividen por el numero de periodos tornados, obteniendose la media aritmetica del 
periodo. Este procedimiento debe ser constante y se va efectuando mediante el desplazamiento a lo largo 
de la serie, es decir, para el segundo promedio se omite el primer periodo pero se le agrega el siguiente, que 
no fue tornado en el promedio anterior. Veamos: 


a) Se tomaron 3 periodos asi: 


— Vi + V? y 28 + 2 + 20 90 

y i =—— -=-=— : 


o 


- _y +y +y + + _ 1 


- y +y +y + + 1 

y = - ---— =-=-= etc 


b) Se tomaron 5 periodos asi: 

— y\ 3^2 y y ^ys 28 + 2 + 20 + 58+72 

y - 5 " 5 

— y^ y y ^ys+yb 2 + 20 + 58 + 72 + 8 

> = —s— = —s— = 6 -^ 

Se puede observar al calcular los promedios moviles de “3 en 3”, se pierden dos periodos (2001 y 
2011); al hacerlo de “5 en 5” se pierden dos arriba y dos abajo; y asi sucesivamente, de ahi que el proce¬ 
dimiento de seleccionar el numero de periodos para calcular el promedio dependera de la longitud de la 
serie. 


Ejemplo 2. Con los mismos datos del ejemplo 1, calcular los promedios moviles de “2 en 2” y “4 en 
4”. 
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Solution: 



De 2 en 2 

De 4 en 4 



Total 

Promedio 

Promedio 

Total 

Promedio 

Promedio 

ANOS 

37 

movil 

movil 


movil 

movil 

movil 


movil 




(C) 

(C) 


(C) 

(d) 

(d) 


(d) 

2001 

28 

* 

70 - 

► 35 







2002 

42 

> 

62 - 

♦ 31 

♦ 

33 

♦ 148 

. > 37 



2003 

20 

* 

78 - 

> 39 


35 

* 192 

> 48 

* 

42,50 

2004 

58 

* 

130 - 

. ♦ 65 

♦ 

52 

-> 188 - 

. ♦ 47 

> 

47,50 

2005 

72 

* 

110 

♦ 55 

+ 

60 

-> 224 - 

> 56 

> 

51,50 

2006 

38 

* 

94 

. ♦ 47 


51 

---> 210 - 

.♦ 52.5 

* 

54,25 

2007 

56 

* 

100 - 

. ♦ 50 

> 

48,5 

* 218 

> 54.5 

> 

53,50 

2008 

44 

* 

124 

. ♦ 62 

> 

56 

-> 256 - 

♦ 64 

> 

59,25 

2009 

80 

♦ 

156 

► 78 


70 

-> 234 - 

.♦ 58.5 

> 

61,25 

2010 

76 

> 

110 

♦ 55 

> 

66,5 





2011 

34 











Si el numero de observaciones es impar como en (a) y (b) del cuadro anterior, el promedio obtenido 
coincide con el periodo central; pero si es par como en (c) y (d), el promedio se coloca entre los dos valo- 
res centrales, procedimiento que en algunas ocasiones hace mas engorroso el proceso, de ahi la costumbre 
del empleo de un numero impar de observaciones. 


c) Se tomaron periodos de dos en dos, asi: JJ | 5 = = ^±1 = 5 


y = 


y +y 


-= 1 


y = 


y +y 


-= y asi sucesivamente. 


d) Se tomaron periodos de cuatro en cuatro, asi: y 2 5 = - 
y 5 = y * +y + = 2 + 20 + 58 + 72 = g> ^ 


■= 7 


En todos los casos, una vez obtenidas las medias o promedios moviles, puede repetirse el proceso, 
tratando de suavizar un poco mas la serie, asi: 


y = 


3^2,5 y ,5 

2 


7+ 8 
2 


2,5 


y 


y, 5 +y ,5 

2 


8+ 7 
2 


7,5 etc 


La manera mas facil de proceder en el calculo de los promedios moviles, consiste en calcular pri- 
mero los tota es mo i es , es decir, los numeradores que luego hay que dividirpor el numero fijo. Algo que 
requiere cierta experiencia, es la determinacion del numero fijo, de tal manera que se obtenga una linea 
mas suavizada que la original. Ya se ha dicho, que puede ser nuevamente suavizada utilizando los prome¬ 
dios moviles obtenidos, a los cuales se les vuelve aplicar el proceso. 
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« APLICACION DEL PROGRAMA DE EXCEL 

t3ll EN PROMEDIOS MOVILES 

Con los mismos datos, correspondientes a la serie de 10 anos, con los que se realizo el ejercicio sobre 
tendencia lineal, podemos calcular los PROMEDIOS MOVILES, en nuestro caso, de tres en tres anos, 
de la siguiente manera: 



Figura No. 4. Analisis de datos. 


®| H 


Inicio Insertar Diseno de pagina 


Borrador 730 - Microsoft Excel 

Formulas Datos Revisar Vista 


) S3 


* O 
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^ Borrar 
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Filtro 

^ Avanzadas 
rdenaryfiltrar 

§3 IB I’ 
A BQ £i 

Texto en Quitar 
columnas duplicados E? ’ 
Herramientas de datos 

-> Agrupar 

- n Ife 

j Analisis de datos 


lll«J ' 

- IJ Propiedades 

Obtener datos Actualizar i 

extern os - todo » isa Editar vinculos 

Conexiones 

ZJ Ordenar 

0 

> Desagrupar ▼ “j 

f|{1 Subtotal 

Esquema fS 

Analisis 


E51 

- 

t 

Ji 


A 

B 

C 

D 


r~^~ 

G 

H 

■ 

r~j i 

K 




1 

Anos 

Venlas 

X 












2 

2002 

28 

1 












3 

2003 

37 

2 












4 

2004 

45 

3 












5 

2005 

39 

4 












6 

2006 

56 

5 












7 

2007 

63 

6 












8 

2008 

78 

7 












9 

2009 

65 

8 












10 

2010 

86 

9 












11 

2011 

93 

10 












12 














= 

13 
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16 
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22 















23 
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^ AP 729 - Paint 


ES 18:25 


□ Seleccionamos la ficha DATOS, y luego hacemos CLIC en la opcion ANALISIS DE DATOS. 

□ Aparece un cuadro de dialogo, correspondiente a ANALISIS DE DATOS, seleccionamos 
MEDIA MOVIL y hacemos CLIC en ACEPTAR. 

□ En el campo RANGO DE ENTRADA tecleamos B2:B11; luego en el RANGO DE SALIDA 
senalamos una CELDA de la hoja de calculo, en nuestro caso, sera la celda E2. 

□ Finalmente hacemos CLIC en ACEPTAR, tal como aparece en las aplicaciones que se presentan 
a continuacion: 


541 


En la SEGUNDA PARTE DEL SIL en internet, encontrara en conjunto toda la aplicacion del EXCEL a la ESTADISTICA, 
que igual al capitulo 13, ofrece una BASE DE DATOS para trabajar. 
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Figura No. 5. Calculo de la Media Movil 
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3 
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2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

2010 
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H ±L 


□LIC 
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Como podemos observar en la columna E2 aparecen los promedios moviles de tres anos. 


Figura No. 6. Resultado calculo de la Media Movil. 
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2 
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4 

2004 

45 

3 


36,66666667 








5 

2005 

39 

4 

40,33333333 







6 

2006 

56 

5 

46,66666667 







7 

2007 

63 

6 

52,66666667 







8 

2008 

78 

7 

65,66666667 







9 

2009 

65 

8 

68,66666667 







10 

2010 

86 

9 


76,33333333 








11 

2011 

93 

10 


81,33333333 
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TENDENCIA PARABOLICA 

La parabola por lo general se aplica en aquellos casos en que la linea poligonal presenta una parte ascendente 
y enseguida una descendente, o lo contrario; generalmente la linea es concava o puede ser convexa 
algunos la utilizan para proyecciones de utilidad, ingresos, etc., aunque su uso en la practica es poco 
frecuente. 

Es una ecuacion de segundo grado. Las curvas de grado superior son poco usadas, por razon de su 
complejidad, ya que en algunos casos requieren de un calculo muy engorroso. Sin embargo las de tercer 
grado suelen ser utilizadas para las funciones de produccion. 


La ecuacion general de la parabola es: 

Y = axf +bx ; +c 

los coeficientes es: 

(i) 

Jjy t = aLx ; 

+ blx t + nc 


(2) 

Yx t y t = dLx t 

+ blx f + cLx ( 


(3) 

lx, y, = dLx t 

, +blx f +cLx t 


El sistema de ecuaciones, para obtener 


Ejemplo 1. Supongamos una serie cualquiera y realicemos un ajuste parabolico tomando como origen el 
primer ano de la serie. Consideremos en primer lugar una serie continua. 


ANOS 

. 

2005 

36 

2006 

28 

2007 

34 

2008 

52 

2009 

58 

2010 

62 

2011 

67 

E 

337 



(1) 337 = 91a + 21b + 7c 

(2) 1.196 = 441a + 91b + 21c Siguiendo el procedimiento de los minimos cuadrados, se da: 

(3) 5.522 = 2.275a + 441b + 91c 


Multiplicamos por- 3 a la primera 
ecuacion y la restamos de la (2) 

(2) 1.196 = 441a + 91b + 21c 
(1) - 1.011 - -273a-63b-21c 

(4) 185 = 168a + 28b + 0 


Multiplicamos por-13 a la primera 
ecuacion y la restamos de la (3) 

(3) 5.522 = 2.275a + 441b + 91c 

m -4.381 - -1.183a -273b-91c 

(5) 1.141 = 1.092a + 168b + 0 


Ahora se tienen las ecuaciones (4) y (5). 

(4) 185 = 168a+ 28b 

(5) 1.141 = 1.092a + 168b 


543 


Multiplicamos a la ecuacion (4) por - 6 y la restamos de la (5) 
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(5) 111= 1 092a + 168Z> 

( 1 -1 11Q = —1 008a-1686 

1= 8a 0 => a = — = 0, 7 

8 


Reemplazamos en la ecuacion (4). 


(4) 1 =16 ( , )+ b 

1 =6 ,16+ b 


=> b = 


1 -6 16 


a = 0,37 


b = 4,39 


Reemplazamos ahora en la ecuacion (1). 

7 = 91(0, 7) + 2l( , 9)+ 7c 

7= ,67 + 92,19 + 7c =* c = +t+ = 0,16 

7 

f = ax 2 +bx + c 7 = 0, 7x 2 + , 9x+ 0,16 


c = 30,16 


El valor de 7 para el ano 2018 sera: 

= 2018 - 2005 = 13 

7 lg = 0,37(169)+ 4,39(13)+ 30,16 = 149,76 

Ejemplo 2. Se puede trabajar con cambio de origen, dandole el mismo tratamiento que se le dio a la 
recta, es decir, que la sumatoria de la columna de X sea igual a cero. 


ANOS 

i 

2007 

36 

2008 

28 

2009 

34 

2010 

52 

2011 

60 

I 

210 


i 

2 

i 

3 

4 

i 

i i 

2 

i i 

2 


-2 

4 

-8 

16 

-72 

144 

1.296 

33,88 

-1 

1 

-1 

1 

-28 

28 

784 

31,67 

0 

0 

0 

0 

0 

0 

1.156 

35,73 

1 

1 

1 

1 

52 

52 

2.704 

46,03 

2 

4 

8 

16 

120 

240 

3.600 

62,69 

0 

10 

0 

34 

72 

464 

9.540 

210,00 


a) 

210 = 10a + 5c 


= aLx^ +nc 

Cuando 

o 

ll 

+ 

(2) 

-C) 

o 

II 

<N 

r- 


= bXxf 


b = 7,2 

( ) 

6 = a + 10c 

Zx, 2 y, 

2 

= aLx f + cljX t 


<N 

r+ 

II 

-O 


Multiplicamos la primera ecuacion por menos 2, y la restamos de la (3) 


( ) 6 = <2 +10c 

(1) - 20 = -20a -10c 
= 1 a 


a = — = 


1 


,1 


a = 3,14 
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C = - 


c = 35,72 


Reemplazamos en la ecuacion (1). 

1 =1 ( 1 )+ c => 

Y= l X + X+ 

Supongamos que se va a estimar el ano 2017, teniendo en cuenta la information anterior, tenemos que: 

Y n = 3,14(64)+ 7,2(8)+ 35,72 = 200,96 + 57,6 + 35,72 = 294,28 
= 2017-2009 = 8 


Cuando se trabaja con cambio de origen y la suma de es igual a 0, se pueden presentar formulas 
simplificadas para obtener directamente los parametros a,byc. 


„ _ nYxfy, -Yxf(Yy) 

riZX' -(Sx, 2 ) 

f 

w w 

II 

^ b = 

72 _ 
10 ” 


5( 6 )-(l0)(210) _ 
5( )-(!0 f ' * 


Xy - a Yx 2 


210 - ,1 ( 10 ) 


5,72 


Ahora se puede determinar el valor de Y mediante un ajuste parabolico: 
Y=ax 2 +bx + c Y- ,1 X 2 +7,2x+ 5,72 


La misma ecuacion obtenida anteriormente. 

Ejemplo 3. Se va a trabajar con cambio de origen, de tal manera que X J =0 cuando la serie es continua 
y tiene ademas un numero par de periodos. 

So ucion: 


ANOS 

i 

2006 

28 

2007 

34 

2008 

52 

2009 

58 

2010 

62 

2011 

76 

£ 

310 


. 

2 

3 

i 

4 

i i 

2 

2 

i 

7. 

-5 

25 

-125 

625 

-140 

700 

784 

27,20 

-3 

9 

-27 

81 

-102 

306 

1.156 

37,74 

-1 

1 

-1 

1 

-52 

52 

2.704 

47,72 

1 

1 

1 

1 

58 

58 

3.364 

57,14 

3 

9 

27 

81 

186 

558 

3.844 

66,00 

5 

25 

-125 

625 

380 

1.900 

5.776 

74,30 

0 

70 

0 

1.414 

330 

3.574 

17.628 

310,10 




Despejamos los valores para aye 

(1) 10 = 70a + 6c 

(2) 57 =1 1 a + 70c 


(1) Xy ; = aljX 2 + nc 

(2) lx 2 y. = aLx f +c?lx 2 
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Multiplicamos la primera ecuacion por 20,2 y se la restamos a la segunda ecuacion con el fin de eli- 
minar a 

b = 4,71 


(1) 6 262= 1 1 a+ 121,2c 

(2) - 57 =-l 1 a- 70c 

(a) 2 688 = 51,2c 


c = 52,5 


2 688 
51,2 


52,5 


Reemplazamos en la primera ecuacion, para despejar el valor de a 


(1) 10 = 70a+ 6 (52,5) => a = — 4 52 ’ 5 ) = _ 0Q7 

a = -0,07 

La ecuacion de la parabola sera: Y = —0,07 2 + 4,71 + 52,5 
= 2016 — 2009 = 7x2 = 14 +1 = 15 semestres 
El valor estimado de Y para el ano 2016 sera: Y x = -0,07(225)+ 4,7l(l5)+ 52,5 = 107,4 


LIMITES DE CONFIANZA 

Se requiere en primer lugar calcular la varianza residual, que se puede obtener mediante la aplicacion de 
una de las siguientes formulas: 

( 2 ) 

No debemos olvidar que muchos la calculan, dividiendo por n- 2, en vez de n. 

Ejemplo 4. Consideremos los datos del ejemplo 1, para calcular la varianza residual y fijar limites de 
confianza del 95 %. 

Solution: 


a) 


4 = VR ■■ 

yx 




,2 _ Sy, - rt,y, - - aZyX 


'yx 


ANOS 

y t 

Y, 

y-Yt 

2005 

36 

30,16 

34,1056 

2006 

28 

34,92 

47,8864 

2007 

34 

40,42 

41,2164 

2008 

52 

46,66 

28,5156 

2009 

58 

53,65 

18,9225 

2010 

62 

61,36 

0,4096 

2011 

67 

69,83 

8,0089 

2 

337 

337,00 

179,0650 


a) 4 

( 2 ) + 


^ = 25,58 
7 

17 6 7- 0,16( 7)- , 9(1196)-0, 7(5 522) 


25,6 


7 
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La desviacion tipica residual sera: 
Los limites de confianza del 95 % 



seran: 


s yx =sj 25,58 =5,06 


±t ~j= 
yjn 


1 9,76 ±2, 7 


5,06 

V7 


: 1 9,76 ± ,68 : 


15 , 

1 5,08 


Se hubiera podido utilizar t = 2,571 con n =n - 2 = 1 - 2 = 5 

Coeficiente de correlacion 


La formula que mas se aplica en la tendencia parabolica es: 




2 



(N 

II 

A*. 

= 

s~ 

1 > A 

2 


II 

5^ 







Ejemplo 5. Con los datos del ejemplo calcular el coeficiente de correlacion parabolico. 


Solution: 

Y~j ^ HJ _ HJ f 7 h) 

Calculamos la varianza de Y siendo s\ =- - -= 201,8 y con el valor obtenido de la 

varianza residual, en este ejercicio S 2 = 25,58 se podra calcular el coeficiente de correlacion al cua- 
drado o coeficiente de determinacion, asi: 


y R = J = 



EJERCICIQS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

39. Con los siguientes datos: 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

i 

234 

171 

147 

124 

140 

144 

206 


Se pide: 

a) Ajustar una parabola, tomando como origen a 2005 y estimar el valor de Y para 2015. 

b) Ajustar una parabola, trabajando con cambio de origen y estimar el valor para 2020. 


40. Con los datos del ejercicio anterior, se pide calcular: 

a) El coeficiente de correlacion parabolica. 

b) El error estandar de estimacion. 

c) Fijar los limites de confianza del 95 % para Y 2Q20 
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41. Con los siguientes datos de una serie discontinua, se pide estimar 7 16 , mediante el ajuste parabolico. 


ANOS: 

1986 

1994 

1999 

2006 

2011 

i 

70 

36 

24 

60 

110 


42. Con los siguientes datos, de una serie continua y par, se pide: 


ANOS: 

2004 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

i * 

56 

42 

70 

82 

41 

63 

110 

84 


a) Estimar Y para el 2013. 

b) Calcular la desviacion tipica residual. 

c) Calcular el coeficiente de correlacion parabolico y elaborar la grafica respectiva. 


43. Con los siguientes datos: 


ANOS: 

1996 

1999 

2002 

2005 

2008 

2011 

i ' 

20 

36 

42 

62 

84 

74 


Se pide: 

a) Mediante un ajuste parabolico, trabajando con cambio de origen (X f = 0 ) estimar el valor de 
7para el 2013. 

b) Trabajando por el metodo de los semipromedios, estimar 7 para 2013, mediante un ajuste 
rectilineo. 

44. Con los siguientes datos: c = 351,1 b=13,188; a = 0,311; . se da por semestres, con origen en 

el primero de Enero de 2006. 

Se pide estimar el valor 7 de para 2016. 

45. Con los siguientes datos: 

Ex, = 0 Xy, = 20 Ex, = 

lx, = Zxfy, = 8 n = 

Mediante un ajuste parabolico: 

a) Estimar al valor de 7 cuando = 20, ademas, fijar limites de confianza del 95%. 

b) Calcular el coeficiente de correlacion al cuadrado. 

c) Con los anteriores datos haga un ajuste rectilineo, dandole a el valor de 20 y compare el 
resultado con el obtenido en el punto (a). 

46. Con los siguientes datos: 


ANOS: 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

_ i _:_ 

20 

26 

42 

58 

78 

63 

42 

36 

14 


Se pide: 

a) Estimar, mediante un ajuste parabolico, el valor de 7para el 2015. 

b) Al valor estimado, calcule el error estandar de estimacion y fije limites de confianza del 95 %. 

c) Calcule el coeficiente de correlacion parabolico. 

d) Haga la representacion grafica para los datos originales y los estimados. 


Ex, =1 Ey, =1 6 

Ex, y t = ; (Ano base 2009) 
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47. Con los siguientes datos: 



a) Estime a 7 2016 y fije limites de confianza del 95 % para el valor estimado, utilizando el ajuste 
parabolico. 

b) Calcule el coeficiente de correlacion y haga la grafica correspondiente. 


MESES 


Enero 

13 

Febrero 

17 

Marzo 

38 

Abril 

50 

Mayo 

40 

Junio 

20 

Julio 

10 


a) Mediante un ajuste parabolico estime el valor de Y para el mes de 
Diciembre. 

b) Fije limites de confianza al 95% 

c) Calcule el coeficiente de correlacion. 

d) Elabore la grafica correspondiente. 


TENDENCIA EXPONENCIAL 


En la practica son numerosas las series que presentan un crecimiento geometrico, considerandose como 
ejemplo tipico la poblacion de una ciudad, region o pais y aquellas variables que guardan relacion con el 
comportamiento de la poblacion, como por ejemplo: ventas, salarios, ingreso nacional, etc., todos ellos 
pueden ser descritos por una ecuacion denominada como inea e ponencia 


La ecuacion general esta dada en la siguiente forma: 


Y=cb 


La ecuacion general es = cb , funcion muy utilizada en matematica financiera, siendo: c { = capital 
inicial; = capital final o monto; b = (l + r) donde r = tasa de crecimiento geometrico o interes compues- 
to mensual, anual, etc., y finalmente = tiempo, siendo: 

P = P. (1 + r) n c= c. (1 + r) 

En la estimacion de una poblacion se tiene P = P Q (1 + r ) n , donde P = poblacion final o estimada; 
P Q = poblacion base o inicial; r = tasa vegetativa y n = tiempo. 


La ecuacion general, se puede expresar en forma logaritmica como: 


log Y = log c + log b 


Las ecuaciones normales para el calculo de los parametros c y b, utilizando el metodo de los mini- 
mos cuadrados, sera: 


(1)S 

log , 

= n log c + (2 ,)log b 

(2)2 

, lo § , 

= (2 ; )logc + (Z ; 2 )log b 


















550 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


Las anteriores ecuaciones se utilizan cuando se toma como origen al primer periodo (anos, meses o 
dias) de la serie o cuando la sumatoria de ., es diferente a 0 (X . ^ 0). Si la sumatoria de . es igual a 
0, los parametros se obtienen directamente en la siguiente forma: 


logc = 


s logz I 

n 


log b = 


^xJogy± 


Ejemplo 1. Aplicaremos en primer lugar este ultimo metodo, en una serie continua y con un numero 
impar de anos, comprendida entre 2005/2011, tal como aparece a continuacion: 

Solution: 


ANOS 

i 

2005 

5.453 

2006 

7.558 

2007 

9.190 

2008 

10.584 

2009 

16.645 

2010 

25.314 

2011 

40.419 

2 

115.163 

(1) C = 

28,8 2 

7 


log , 

i 

, lo g, 

2 

i 

3,73664 

-3 

-11,20992 

9 

3,87841 

-2 

-7,75682 

4 

3,96332 

-1 

-3,96332 

1 

4,02465 

0 

0 

0 

4,22128 

1 

4,22128 

1 

4,40336 

2 

8,80672 

4 

4,60658 

3 

13,81974 

9 

28,83424 

0 

3,91768 

28 


(2) b = ,91768 = 0,1 9917 
28 




logb = 


Zx, logy, 


c = 13.157,61 


b = 1, 801 


Los valores estimados se obtendran por cualquiera de las dos formulas: 


a) log Y= 4,119176 + 0,139917 ( ) 

b) Y= 13.157(1,3801) (los resultados deben ser iguales, si se trabaja con todos los decimales) 


Si se desea estimar el valor de Y para el 2018 se tendra: 

a) log f 18 = 4,119176 + 0,139917(10) = 4,119176 + 1,39917 = 5,518346 

Si se obtiene el antilogaritmo, sera: Y n = 329.872,41 = 2018-2008 = 10 

b) f 18 = 13.157(1,3801) 10 = 329.808,95 


La tasa de crecimiento para esta serie se obtiene de la siguiente manera: primero se determina el 
antilogaritmo para el log b = 0,139917 -» b = antilog de 0,139817 = 1,3801. 


b = 1 + r 


siendo r la tasa de crecimiento geometrico. 


En segundo lugar, se sabe que 
Si b = 1+ r = 1,3801, se tendra que r = 0,3801 6 r = 38,01% o 380,l%o 6 de acuerdo como se 
considere debe presentarse. 


Ejemplo 2. Hagamos el estimativo para 7 , con la serie que se ha venido trabajando, correspondiente 
al periodo 2005-2011, siendo continua, para 2 { ± 0, es decir, tomando como origen el primer periodo 
de la serie: 
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Solution: 


i 

2 

i 

log ; 

;l°g ; 

0 

0 

1,55630 

0 

1 

1 

1,44716 

1,44716 

2 

4 

1,53148 

3,06296 

3 

9 

1,71600 

5,14800 

4 

16 

1,76343 

7,05372 

5 

25 

1,79239 

8,96195 

6 

36 

1,82607 

10,95645 

21 

91 

11,63283 

36,63024 


logb;- 

Y, 

(log ,) 2 

1,47629 

29,94 

2,42208 

1,53813 

34,52 

2,09427 

1,59999 

39,81 

2,34543 

1,66183 

45,90 

2,94466 

1,72368 

52,93 

3,10967 

1,78553 

61,03 

3,21267 

1,84738 

70,37 

3,33453 

11,63283 

334,50 

19,46331 



En el cuadro anterior observamos que X . ^ X7. y que X log 


»= s log 


Y. 

i 


Ahora procedemos a calcular los log b y log c siguiendo el procedimiento de los mmimos cuadra- 
dos, para ello reemplazamos los valores que aparecen en la tabla, en el sistema de ecuaciones normales. 


(1) 11,63283 = 7 log c+21 logb 

(2) 36,63024 =21 log c + 91 log b 


Multiplicamos la ecuacion (1) por -3 y lo restamos de la ecuacion (2). 


(2) 36,63024 = 21 log c + 91 log b 

(1) - 34.89849 = -21 log c - 63 log b 
1,73175 = 0 28 log b 

Siendo: logb= 1J 0 3 J 75 =0,06185 

ZO 


log/? = 0,06185 


b = antilog 0,06185 = 1,1530. La tasa de crecimiento sera: r = 15,30% 6 153% 0 . 


Reemplazamos el valor del log b, en la primera ecuacion, para determinar el log c. 

(1) 11,63283 = 7 log c + 21(0,06185) log c = 11^3283 -21(0,06185) = 1,47529 

La fimcion logaritmica sera: log Y = 1,47629 + (0,06185). Si se desea estimar el ano 2018 se 

tendra que: 

log f 18 = 1,47629 + 13 (0,06185) = 2,2803; Siendo: Y= antilog de 2,2803 
f 18 = 190,68 Cuando =2018-2005 = 13 

Limites de confianza. Primero que todo se debe calcular la arian a residua y luego la des iacion 
tipica residua , a fin de obtener el error estandar de estimacion. Las formulas mas usadas son: 


-VR- Xi 

{ y- y] 

f 

u v . V J\ 

* y 

n 
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Ejemplo 3. Con los datos y calculos realizados en el Ejemplo 2, calcularemos las medidas anteriores. 

Solution: 


ANOS 

logT, 

log F, 

(log -log ff 

2005 

1,55630 

1,47629 

0,00640 

2006 

1,44716 

1,53813 

0,00828 

2007 

1,53148 

1,59999 

0,00469 

2008 

1,71600 

1,66183 

0,00293 

2009 

1,76343 

1,72368 

0,00158 

2010 

1,79239 

1,78553 

0,00005 

2011 

1,82607 

1,84738 

0,00045 

2 

11,63283 

11,63283 

0,02438 


2 _A J Vif-n yt 

o 

> n 


11,6 28 
7 



,19,6 1-7(1,6618 

> 7 ’ 

1,6618 (varianza y media logaritmica) 


(i) * 


2 

* > 


S 


2 

j > 


0,02 

7 

19, 6 


- = 0,00 8 

1-1, 7629(11,6 28 )-0,06185( 6,6 02 ) 
7 


= 0,00 


7 


La diferencia observada es muy pequena, comparando los resultados anteriores. Tambien se puede ha- 
cer el calculo de la varianza residual, de la siguiente manera: 

i) >= ^ 2 > a- J Ry 

Siendo: s 2 x y =0,01878(1-0,81 5 )= 0,00 8 


Coeficiente de correlation. A1 igual que la tendencia rectilinea y parabolica, este coeficiente se puede 
calcular aplicando diferentes formulas, cuyos resultados son aproximadamente iguales. 


(1) r 2 =R 2 = l-~£- 
5 > 


(2) r — 

nix, y,gZ ; (Zlog ,.) 


- (lx, f ] [//l( y,f] 



Ejemplo 4. Con los datos y resultados del ejemplo 3, calcular el coeficiente de correlacion. 
Solution: 

(1) 7? 2 = 1- °’ QQ 8 =0,81 5 r = V0,81 5=0,90 

0,01878 
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(2) r = 


7 ( 6,6 02 )- (21) (11,6 28 ) 
yj [ 7 (91)— (21 j 2 ] [ 7 (l 9, 6 )- (l 1,6 28 71 


- 0,90 


EJERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


49. Los ultimos censos de poblacion efectuados en un pais latinoamericano arrojaron los siguientes 
resultados: 


ANOS: 

1956 

1969 

1979 

1999 

2011 

POBLACION (miles): 

3.221 

3.715 

4.287 

5.024 

6.933 


a) Se pide estimar la poblacion de dicho pais para el ano 2015. 

b) Determinar la tasa de crecimiento anual. 

c) El error estandar de estimacion. 

d) El coeficiente de correlacion. 

e) Entre que valores estara la poblacion para el 2017 con una probabilidad del 95%. 

50. La poblacion de un pais en 2001 era de 12 millones; en 2011 fue de 21 millones. 

Se desea determinar: 

a) La tasa de crecimiento. 

b) La poblacion estimada para el 2017. 

51. Si las importaciones (M) de una mercancia se duplican en un periodo de 4 anos, ^cual es la tasa 
media acumulativa de incremento anual? 

52. Un capital de 20 millones de pesos. /,En cuantos anos, a una tasa del 7% se duplicara? 

53. Con la siguiente informacion: 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

IPRA*: 

100,0 

102,0 

105,1 

109,3 

113,1 

116,5 

120,3 


* Indice Production Real Agricola. 

Se pide: 

a) Establecer la ecuacion para el ajuste exponencial. 

b) La tasa de crecimiento acumulativo anual. 

54. Si en el 2005 el valor de Y es 120 y en el 2011 es de 460. Se pide, con esos dos periodos, determinar la 
tasa de crecimiento geometrico, ademas estimar el valor de Y para el 2015. 

55. De acuerdo con el plan de desarrollo de un pais, se comprueba que el producto real del sector 
agricola muestra los siguientes crecimientos porcentuales anuales en el periodo 2005/2011. 
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ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

CRECIMIENTO BASE %: 


2,0 

3,6 

4,2 

3,8 

3,4 

3,5 

INDICE: 

100,0 

102,0 

105,6 

110,1 

114,3 

118,2 

122,3 


En una serie encadenada, teniendo en cuenta los crecimientos porcentuales en cada ano: 

a) Determine la tasa anual promedio de crecimiento (geometrico) para el periodo considerado. 

b) Estime el indice para 2013 manteniendo constante la base 2005. 


56. Un capital de $50,000 colocado a una tasa de interes compuesto del 1,75% mensual. 

a) A los cuantos anos se triplica el capital? 

b) Si se coloca ese capital ($50,000) el 1° de Enero de 2005 a la misma tasa de interes, ^cual sera 
el capital al 31 de Diciembre de 2011? 

57. Con los siguientes datos: 

2 .= 105 Z 2 = E015 Z log . = 80,33100 Z .log . = 583,45830 
n= 15 = 0 para 1996 (primer ano de la serie). 

Se pide: 

a) Determinar la tasa de crecimiento anual. 

b) Estimar el valor de 7, para 2013 mediante el ajuste exponencial. 

58. Dados los siguientes datos sobre la produccion de un empresa, en millones de unidades. 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

PRODUCCION: 

150 

140 

180 

220 

190 

380 


Se pide estimar la produccion para el ano 2016 y calcular los coeficientes de correlacion, 
mediante el: 

a) el ajuste exponencial. b) el ajuste rectilineo y el coeficiente de correlacion. 


59. Con los siguientes datos, correspondientes al PN.B. de un pais cualquiera. 

Z . = 0 Z log . = 28,744073 Z .log . = 1,708451 Z 2 = 60 n = 9 

Si se sabe que el origen esta localizado en el ano 2007, se pide determinar mediante un ajuste 
exponencial. 

a) La tasa de crecimiento anual. b) El valor estimado de Y , para el 2015. 

60. Un capital puesto a una tasa de interes anual del 24,8%, al cabo de 4 anos se transformo en 
$2,580,000. ^Cual fue el valor del capital inicial? 

61. Un capital de $150,000 se triplica al cabo de 8 anos. a) ^Cual es la tasa acumulativa anual? 

b) Si el capital se coloco el primero de enero de 2006, /,Cual sera el capital a 31 de diciembre 2011, si 
se mantiene dicha tasa? 

c) /,Cual es la tasa acumulativa mensual, con el enunciado de este ejercicio? 

62. Siendo: n = 14 Z log .= 18,43915 Z f = 819 Z(log J 2 = 36,87826 
Z i= 91; Z f log t = 129,55270 Para 1997 tomando como origen =0. 

a) Se pide estimar Y iy 

b) Calcular el coeficiente de correlacion exponencial. 
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OTROS METODOS UTILIZADOS EN EL ANALISIS DE LA TENDENCIA 


En forma breve se exponen otros procedimientos utilizados en el analisis de series, dependiendo del tipo 
de variable y analisis que se disponga. 

CURVA EXPONEN Cl AL MODIFICADA 


Es una curva analoga a la e ponencia , la cual se modifica agregando una constante a, que sirve 
simplemente para indicamos el desplazamiento de la curva hacia arriba o hacia abajo en una cantidad 
constante, usada especialmente en aquellos casos en que los valores de la serie tienen una marcada 
tendencia hacia un limite superior o inferior. 


La ecuacion es: 


Y = a + cb 


CURVA LOGISTICA 

Esta curva esta dada por la ecuacion: 


Y = 


_ 1 _ 

a + cb 


Como se puede observar, corresponde al reclproco de la exponencial modificada, donde los valores a , 
b y C se obtienen de la misma manera que en la exponencial modificada , la que, a su vez, muestra una tasa 
de crecimiento o de decrecimiento relativamente grande al comienzo, pero que disminuye al final de la serie. 

CURVA DE GOMPERTZ 

Es tambien una cur a de tendencia , como las anteriores, que se expresa mediante la formula de 
y cuyo nombre corresponde a Benjamin Gompertz, quien la utilizo en estudios 
de mortalidad. Su forma de calculo se simplifica empleando logaritmos, siendo: 
log = log a + (b )logc 


Y— a 4- c b 
sobre tablas 


METODO DE LOS COMPONENTES 


No es propiamente una linea de tendencia, pero si es un metodo que nos permite calcular el valor para los 
periodos siguientes, en especial para estimar la poblacion de una ciudad, region o pais. Este metodo se 
obtiene tomando la poblacional inicial o base, correspondiente al ultimo censo (P o ), a este valor se le 
suman los nacidos vivos en el periodo (N); menos las defunciones en el periodo (D) y mas o menos las 
migraciones (M). 

P x = P o + N-D±M 


METODO GRAFICO 


Denominado tambien de mano a ada o metodo a mano ibre Establecido para describir las relaciones 
en una serie de datos ordenados en el tiempo o en el espacio. En algunos casos, la tendencia se establece 
aplicando el metodo a mano fibre o mano alzada, sin empleo matematico, trazando una linea (recta, 
parabolica, exponencial, etc.) que pase por o cerca de los puntos que representan graficamente las 
observaciones. Generalmente se trata de que la linea pase por el centro de la (linea) poligonal o datos 
observados. 
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El metodo en un principio parece muy sencillo, pero la bondad del resultado depende de la persona 
que lo aplique, pues se requiere experienciay conocimiento del comportamiento de la variable, para lograr 
la proyeccion al periodo deseado. La critica que se le hace a este procedimiento es su caracter subjetivo, 
dado que el resultado o sea el trazo de la linea, depende de la persona que lo haga; sin embargo se dice, que 
si es bien aplicado su resultado puede ser mejor que los otros metodos matematicos que hemos denomina- 
do metodos ana iticos 


EJERCICIOS MISCELANEOS PARA RESOLVER 


La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

63. Dada la siguiente informacion, correspondiente a una serie de tiempo. 


ANOS: 

2006 

2007 

2008 

2009 

2010 

2011 

i 

70 

56 

74 

80 

96 

114 


El valor para Y en el 2016, mediante un ajuste rectilineo sera: 

a) 135,4 b) 138,6 c) 144,2 d) 151,6 e) 155,8 


64. Si se dispone de los siguientes datos y mediante un ajuste rectilineo. 

Se podra decir que el coeficiente angular (crecimiento anual) es de: 
a) 12 b) 16,8 c) 20,4 d) 22,5 e) 25,6 


65. Con los siguientes datos, correspondientes a las ventas trimestrales de un almacen: 


Se pide: 


a) Mediante un ajuste rectilineo, estimar el valor de las ventas 
correspondientes al primer trimestre de 2013. 

b) Mediante el ajuste parabolico, trabajando con cambio de 
origen (l .= o), estimar los meses de Septiembre de 2010 y 
Diciembre de 2011. 


66. Con la ecuacion obtenida para el ajuste rectilineo y el parabolico, junto con los datos reales de 
las ventas, elaborar la grafica correspondiente (las tres lineas en una sola grafica). (trabajar con el 
ejercicio N° 65). 


ANOS 

MESES 

VENTAS 
(millones ) 

2009 

Octubre 

75 


Enero 

92 


Abril 

63 

2010 

Julio 

107 


Octubre 

94 


Enero 

130 


Abril 

68 

2011 

Julio 

162 


Octubre 

134 


ANOS 

Yi 

Y. 

l 

2006 

18 

15 

2011 

72 

75 



67. Utilizar el metodo de los semipromedios (en el ejercicio No. 65) para estimar los meses de 
Septiembre de 2010 y Diciembre de 2011. 
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68. Un capital de 300 millones de $. ^Encuantos anos se duplicaria, si se tiene: 

a) una tasa de interes al 2% mensual? 

b) una tasa de interes anual del 32%? 

69. Con los siguientes datos, se pide determinar por el metodo que considere conveniente: 

a) La tasa de crecimiento aritmetico. 

b) La tasa de crecimiento geometrico. 


70. Con la informacion del ejercicio anterior, estime el valor de Y para el 2015, mediante un ajuste rectilineo 
y luego, mediante un ajuste logaritmico. 

71. De respuesta en forma abreviada a cada uno de los siguientes interrogantes. 

a) lQug utilidad practica le ve al analisis de una serie de tiempo? 

b) ^Que entiende por: tendencia; variaciones estacionales; movimientos ciclicos; variaciones 
aleatorias? 

c) i Enque difieren los modelos de adicion y de multiplicacion en las series de tiempo? 

d) i En que consiste el metodo de mano alzada? 

e) iQue opina del metodo de los semipromedios? 

f) i En que consiste la suavizacion de una linea? 

g) i En que consiste la desestacionalizacion de una serie? 

72. En series de tiempo al calcular el coeficiente de correlacion, i Como interpreta los siguientes 

resultados? r = 1 r = 0,9 r = 0,20 r = -1 

73. En un ejercicio, respecto a una serie de tiempo, se obtuvo que, r = 1,32, ^como lo interpretaria? 

74. Un Instituto de educacion superior, lleva un registro periodico sobre la tasa de mortalidad 
academica. 


ANOS: 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

TASA %: 

11,3 

2,5 

8,3 

7,6 

18,9 

12,6 

18,3 


a) Trace los datos anteriores en una grafica. 

b) Haga un ajuste rectilineo y trace la recta en la grafica anterior. 

c) Haga un ajuste parabolico y trace la linea en la misma grafica solicitada anteriormente. 


75. Con los datos del ejercicio 74, se pide que: 

a) Haga un pronostico para el ano 2013 con los dos ajustes. 

b) Fije los limites de confianza del 95% en ambos casos. 

c) Obtenga el coeficiente de correlacion y determine cual de los dos ajustes aceptaria o 
recomendaria. 

76. a) Con los datos del ejercicio anterior ajuste una linea exponencial, estime la tasa para el 2013 y fije 

limites del 95% para el valor estimado. 

b) Calcule el coeficiente de correlacion ^Que opina respecto de los resultados del ejercicio 
anterior? 


ANOS 

y, 

y\ 

Y 

l 

2006 

120 

110 

2011 

480 

516 
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VARIACIONES ESTACIONALES 


En los componentes de una serie, se mencionaban las ariaciones estaciona es, cuya duracion puede ser 
de un ano (de acuerdo a las estaciones del ano), o periodos mas cortos de un mes o un dia; en estos 
ultimos generalmente se consideraba como ejemplo, el movimiento de pasajeros en el transporte urbano 
donde encontramos horas pico de mucha congestion y minimas a otras horas del dia; algo similar se 
observa con el consumo de energia en las 24 horas del dia. En los supermercados vemos como aumentan 
las ventas en los dias de pago (quincenal o mensual); en las tabernas los dias finales de la semana o en los 
aeropuertos y terminales de transportes en las temporadas de vacaciones. 

Es costumbre, en el analisis de una Serie de tiempo, en cuanto al segundo componente, expresar las 
fluctuaciones estacionales utilizando indices, mediante los cuales pueden ser aplicados facilmente a cual- 
quier serie similar. 

CALCULO DE INDICES ESTACIONALES 

Supongamos que en la terminal de transporte, de una ciudad, de un pais cualquiera, el movimiento 
de pasajeros intermunicipales, en miles, es como sigue: 


Numero de pasajeros transportados durante 2009-2011. 


MESES 

2009 

2010 

2011 

SUMA 

PROMEDIO 

( IVE ) 
fNDICE 
VARIACION 
ESTACIONAL 

Enero 

796 

680 

948 

2.424 

808 

160,54 

Febrero 

712 

548 

552 

1.812 

604 

120,00 

Marzo 

696 

632 

640 

1.968 

656 

130,34 

Abril 

448 

512 

504 

1.464 

488 

96,96 

Mayo 

408 

384 

416 

1.208 

404 

80,27 

Junio 

368 

336 

372 

1.076 

360 

71,52 

Julio 

400 

388 

448 

1.236 

412 

81,86 

Agosto 

364 

376 

392 

1.132 

376 

74,71 

Septiembre 

452 

432 

508 

1.392 

464 

92,19 

Octubre 

432 

412 

472 

1.316 

440 

87,42 

Noviembre 

420 

416 

464 

1.300 

432 

85,43 

Diciembre 

588 

564 

640 

1.792 

596 

118,42 

TOTAL 

6.084 

5.680 

6.356 

18.120 

6.040 

1.199 12 

503 3 


El procedimiento a seguir es: 


■ Sumamos la informacion para el mes de cada periodo y obtenemos la columna 
suma. 

■ Calculamos el promedio para cada mes, por ejemplo en Enero sera 2.424/3 = 808. 

■ Sumamos el valor correspondiente a la columna promedio, dividimos entre 12 y nos 
da 503,3, es decir, 6.040 -r 12 = 503,3. 
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■ Dividimos cada uno de los promedios mensuales por el promedio total (503,3) y el 
resultado lo multiplicamos por cien, as! obtenemos el Indice de variacion estacional. 

■ La suma del indice de aviation estaciona debe ser exactamente igual a 1.200; 
como se puede ver el resultado de nuestro ejercicio fue 1.199,12 y la diferencia se 
debe a las aproximaciones. 


Es necesario tener en cuenta que en la mayoria de los casos los indices resultan influenciados por la 
endencia , en especial cuando en ella se refleja la inflacion (cuando la serie corresponde a valores o pre- 
cios) que vale la pena tener presente; por tal razon se debe corregir la serie por medio de la deflactacion, 
como se indico en el capitulo anterior sobre n meros indices 

INDICE ESTACIONAL 

METODO DE RAZON RESPECTO A LA TENDENCIA 


Se aconseja, antes de construir los ndices estaciona es mensua es, eliminar las variaciones dadas por 
la endencia. 

\bamos con el siguiente ejercicio, uno de los procesos que generalmente se sigue, en cuanto a los 
precios de un determinado articulo. 


Precios de un determinado articulo durante los meses de 2007 al 2011 


MESES 

2007 

2008 

2009 

2010 

2011 

Enero 

316 

340 

366 

384 

412 

Febrero 

300 

320 

342 

376 

392 

Marzo 

358 

380 

394 

410 

438 

Abril 

348 

386 

410 

424 

470 

Mayo 

370 

404 

424 

450 

476 

Junio 

378 

406 

414 

444 

476 

Julio 

358 

382 

410 

442 

482 

Agosto 

366 

398 

420 

436 

460 

Septiembre 

362 

378 

384 

426 

454 

Octubre 

376 

412 

430 

452 

502 

Noviembre 

384 

418 

430 

434 

504 

Diciembre 

458 

482 

502 

554 

612 

TOTAL 

4.374 

4.706 

4.926 

5.232 

5.678 


a) Trabajando con los totales para cada ano podemos determinar la tendencia, procedimiento mas 
agil que haciendolo con todos los meses. 
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CALCULO DE LA TENDENCIA 



b = 5(52 966)- (10)(2 916) _ ] __ 2 916- 1 , (l0) _ 56 

5(0)-10 2 ’ 5 

Y = 1 , x+ 56, 

Nota: Los valores anuales corresponden a acumulados mensuales. 

b) La ecuacion anterior utilizada para hacer estimaciones anuales, la transformamos en otra ecuacion 
que emplearemos para estimar valores mensuales. Como se observa, los valores para y de cada 
ano son el resultado de la sumatoria de los 12 meses. El cambio se obtiene dividiendo a por 
144 y a C por 12, de acuerdo a la tabla anterior. 

Y = — — x + - — Y= 16 x+ 6 

1 1 

Nota: los anos corresponden a acumulados mensuales. 

En la ecuacion anterior, el origen estara situado el 10 de julio de 2007, siendo la unidad de tiempo = 
11 meses y el precio mensual ( ). Decimos que la informacion se da al primero de Julio por ser la mitad 
del ano, asi que por comodidad trasladamos el origen al 15 de Enero del mismo ano, siendo la ecuacion 
resultante: 

Y= 2,17639(-5,5) + 363,03333 = 351,06 valor que sera el nuevo coeficiente, C = 351,06318 
cuando: = 0 al 15 de Enero de 2007. 

La ecuacion resultante sera: 7=2,17639 +351,06318. 

c) Calculamos los valores estimados para cada mes, utilizando la ecuacion anterior, haciendo que 

= 0 para enero de 2007; = 1 Febrero del mismo ano; = 2 Marzo y asi sucesivamente. 

Estos valores aparecen en la tabla siguiente (por comodidad trabajamos con un decimal). 

Calculo de los valores estimados 


MESES 

2007 

2008 

2009 

2010 

2011 

Enero 

351,0 

377,2 

403,2 

429,4 

455,6 

Febrero 

353,2 

379,4 

405,4 

431,6 

457,8 

Marzo 

355,4 

381,6 

407,6 

433,8 

459,8 

Abril 

357,6 

383,8 

409,8 

436,0 

462,0 

Mayo 

359,8 

385,8 

412,0 

438,2 

464,2 


ontin a 
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Junio 

362,0 

388,0 

414,2 

440,2 

466,4 

Julio 

364,2 

390,2 

416,4 

442,4 

468,6 

Agosto 

366,2 

392,4 

418,6 

444,6 

470,8 

Septiembre 

368,4 

394,6 

420,8 

446,8 

473,0 

Octubre 

370,6 

396,8 

422,8 

449,0 

475,2 

Noviembre 

372,8 

399,0 

425,0 

451,2 

477,2 

Diciembre 

375,0 

401,2 

427,2 

453,4 

479,4 


d) El paso a seguir, consiste en dividir los valores reales para cada mes por el respectivo valor de 
la Tendencia, cuyos resultados aparecen a continuacion. 

Indices para cada mes 


MESES 

2007 

2008 

2009 

2010 

2011 

Enero 

0,9003 

0,9014 

0,9077 

0,8443 

0,9043 

Febrero 

0,8494 

0,8434 

0,8436 

0,8712 

0,8563 

Marzo 

1,0073 

0,9958 

0,9660 

0,9451 

0,9526 

Abril 

0,9732 

1,0057 

1,0050 

0,9725 

1,0173 

Mayo 

1,0283 

1,0472 

1,0291 

1,0269 

1,0254 

Junio 

1,0442 

1,0464 

0,9995 

1,0086 

1,0206 

Julio 

0,9830 

0,9790 

0,9846 

0,9991 

1,0286 

Agosto 

0,9995 

1,0143 

1,0033 

0,8807 

0,9771 

Septiembre 

0,9826 

0,9579 

0,9125 

0,9534 

0,9598 

Octubre 

1,0146 

1,0383 

1,0170 

1,0067 

1,0564 

Noviembre 

1,0300 

1,0476 

1,0118 

0,9618 

1,0562 

Diciembre 

1,2213 

1,2014 

1,1751 

1,2219 

1,2766 


e) En la penultima columna aparece el promedio mensua para los cinco anos, as! que para ello 
sumamos las 5 cantidades correspondientes al mes de Enero, siendo iguales a 4,508; luego 
dividimos entre 5, con resultados de 0,9016. 


PROMEDIO MENSUAL 

fNDICE ESTACIONAL 

0,9016 

90,25 

0,8528 

85,37 

0,9735 

94,75 

0,9938 

99,48 

1,0314 

103,25 

1,0239 

102,05 

0,9949 

99,59 
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0,9950 

99,60 

0,9532 

95,42 

1,0266 

102,77 

1,0215 

102,26 

1,2193 

122,06 

11,9875 

1.200,00 


■ La suma de la penultima columna nos dara 11,9875 y la dividimos entre 12: 
11,9875/12 = 0,998958. 

■ Luego cada promedio mensua lo dividimos por 0,998958 y lo multiplicamos por 
100; nos resulta el Indice tal como aparece en la ultima columna. 


Si se trabaja la ultima columna, con todos los decimales la suma debe ser igual a 1.200,00 


INDICES ESTACIONALES 

METODO DE LAS RAZONES AL PROMEDIO MOVIL 


Consideremos los precios bimestrales para un determinado articulo, durante los ultimos diez anos. 


Precios de un articulo para el periodo 2002 al 2011 



Generalmente se consideran los doce meses del ano para calcular los ndices estaciona es o si se 
desea desestacionalizar una serie, sin embargo con fines de simplificacion se ha dado la informacion por 
bimestre, pero el procedimiento a seguir con 6 o 12 periodos es casi el mismo. 

Los pasos requeridos al utilizar el Metodo de las razones al promedio (media) movil, son: 

a) Lo primero que hacemos consiste en calcular los Totales Moviles tomando de seis en seis 
bimestres (se podria, en el caso de tener los 12 meses, de doce en doce). Como seis o doce son 
numeros par, cada total movil se debe ubicar en la mitad de los dos periodos (bimestres o meses). 

Siendo 390 + 304 +312 + 354 + 412 + 460 = 2.232 este valor se situa entre el 3° y 4° bimestre; 
luego sera: 304 + 312 + 354 + 412 + 460 + 390 = 2.232, situandolo entre el 4° y 5° bimestre y asi 
sucesivamente, quitando el primer periodo a la sumay agregando el siguiente valor al ultimo de la 
serie anterior, o sea 354 + 412 + 460 + 390 + 308 = 2.236. 
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Totales moviles 



b) Luego procedemos a centrar la informacion, es decir, que e tota corresponda a cada periodo o 
bimestre (puede ser mensual), para ello se obtienen unos nuevos tota es mo i es con dos bimestres 
(o dos meses), proceso conocido como Totales Moviles Centrados. El proceso sera: 2.232 + 
2.232 = 4.464 y lo situamos en el 4° bimestre, luego 2.232 + 2.236 = 4.468 y corresponded al 5° 
bimestre; 2.236 + 2.242 = 4.478 correspondiente al 6° bimestre y asi sucesivamente. 


Totales moviles centrados 



c) Seguimos con el calculo de los promedios (medias) mo i es , dividiendo cada total entre 12, 
ya que cada uno de los totales es el acumulado de dos sumandos de la tabla, y cada sumando 
es el resultado de seis sumandos o seis periodos. Si se hubiese trabajado con los doce meses 
dividiriamos cada total por 24. El procedimiento seguido es: 4.464 t 12 = 372; 4.468 t 12 = 372 
y asi sucesivamente; se podra observar que se han despreciado los decimales, por dos motivos: 
espacio y agilizacion de las operaciones. 


Promedios (medias) para cada periodo 
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5 

372 

390 

406 

444 

512 

548 

536 

542 

504 

- 

6 

374 

394 

412 

454 

518 

546 

534 

546 

498 

- 


Con este procedimiento se logro eliminar las ariaciones estaciona es, dado que el periodo de la 
media movil presenta coincidencia con la periodicidad de esas variaciones. Por otra parte, vale la 
pena recordar que los promedios o medias mo i es son una forma de suavizar una serie, por tanto 
suponemos que se han eliminado aquellas variaciones consideradas como aleatorias o accidentales. 

d) Ahora se calcularan los porcentajes o ra ones a los promedios o medias moviles presentados en el 
cuadro anterior, mediante una operacion sencilla, dividiendo a cada uno de los precios reales, que 
anteceden al ordinal (precios de un articulo para el periodo 2002 - 2011) por el respectivo promedio 
movil, (promedios para cada periodo) y se obtienen los cuocientes o relativos para cada periodo, 
los cuales multiplicados por 100, los convertimos en porcentajes. 

Ejemplos: (354-r 372) 100 = 95,16 6 95,2; (412 * 372) 100= 110,75 6 110,8; (460^-374) 100 = 
122,99 o 123,0 y asi sucesivamente. Por comodidad trabajaremos con un decimal. 


Indices estacionales 


BIMESTRES 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

2010 

2011 

1 

- 

104,3 

104,0 

101,0 

98,3 

100,0 

102,6 

99,6 

106,3 

94,4 

2 

- 

81,5 

82,5 

83,1 

85,7 

85,8 

83,8 

79,4 

83,3 

84,0 

3 

- 

83,2 

84,6 

87,4 

91,0 

88,5 

81,6 

84,6 

86,5 

86,9 

4 

95,2 

85,9 

95,5 

99,1 

98,0 

98,5 

100,0 

101,5 

97,4 

- 

5 

110,8 

110,3 

111,8 

109,9 

109,0 

111,3 

114,6 

110,0 

112,7 

- 

6 

123,0 

129,9 

120,9 

117,2 

118,9 

119,0 

121,0 

119,4 

116,5 

- 


Los porcentajes obtenidos en el cuadro anterior son considerados indices estaciona es, cuando 
las variaciones para los periodos correspondientes a una “estacion” son cambiantes o evolutivas en el 
transcurso de los anos estudiados; en muchos casos estos cambios se deben a la variacion en los habitos 
de consumo. 

En caso contrario, es decir, cuando son estables para esos periodos, los indices de ariacion estacio¬ 
na se pueden tomar como promedio para cada periodo, en este caso, para cada bimestre. 


Indice estacional 


BIMESTRE 

1 

2 

3 

4 

5 

6 

INDICE 

101,2 

83,3 

86,1 

98,0 

111,3 

120,1 



































CAPfTULO ONCE 

SERIES CRONOLOGICAS 


565 


AJUSTE ESTACIONAL 

Se procedio anteriormente al calculo del ndice estaciona para cada periodo y ano. Ahora procedemos 
a calcular la variable pero desestacionalizada, cuyo proceso es muy sencillo, dividiendo las cantidades, 
precios o valores reales, es decir, los valores observados, por los respectivos indices estacionales. 

Consideremos los dos ejemplos anteriores, ventas y precios, para desestacionalizarlos. En el primer 
ejemplo (ventas) se tomara en consideracion el ano de 2011; para ello el primer mes desestacionalizado 
sera: 412 + 0,9025 = 456,51; para Febrero sera: 392 + 0,8537 = 459,18; Marzo 438 + 0,9475 = 462,27 
y asi sucesivamente. Veamos los resultados en la tabla siguiente: 


Ventas desestacionalizadas para los meses de 2011 


MESES 

VENTAS REALES 

INDICE ESTACIONAL 

VENTAS 

DESESTACIONALIZADAS 

Enero 

412 

90,25 

456,51 

Febrero 

392 

85,37 

459,18 

Marzo 

438 

94,75 

462,27 

Abril 

470 

99,48 

472,46 

Mayo 

476 

103,25 

461,02 

Junio 

476 

102,05 

466,44 

Julio 

482 

99,59 

483,98 

Agosto 

460 

99,60 

461,85 

Septiembre 

454 

95,42 

457,79 

Octubre 

502 

102,77 

488,47 

Noviembre 

504 

102,26 

492,86 

Diciembre 

612 

122,06 

501,39 


Precios desestacionalizados para los bimestres - 2011 


BIMESTRE 

PRECIOS 

INDICE 

ESTACIONAL 

PRECIOS 

DESESTACIONALIZADOS 

1 

468 

101,2 

462,46 

2 

410 

83,3 

492,20 

3 

426 

86,1 

494,77 

4 

516 

98,0 

526,53 

5 

492 

111,3 

442,05 

6 

684 

120,1 

569,53 


468 

1,012 

410 


= 462,46 


= 492,20 etc 


0,833 
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EJERCICIOS PARA RESOLVER 


La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


77. Con los siguientes datos, correspondientes a miles de unidades vendidas por mes, durante cinco 
anos. 


MESES 

2007 

2008 

2009 

2010 

2011 

Enero 

520 

610 

716 

750 

805 

Febrero 

410 

520 

620 

690 

754 

Marzo 

300 

480 

600 

650 

712 

Abril 

380 

500 

450 

520 

610 

Mayo 

260 

320 

410 

480 

680 

Junio 

390 

390 

380 

410 

520 

Julio 

480 

494 

490 

560 

610 

Agosto 

400 

450 

500 

520 

540 

Septiembre 

280 

320 

412 

470 

510 

Octubre 

250 

300 

400 

430 

680 

Noviembre 

360 

412 

570 

694 

784 

Diciembre 

760 

814 

850 

910 

1.020 



Se pide: 

a) Calcular los Indices estacionales aplicando las tres formas desarrolladas, en el capitulo. 

b) Desestacionalizar la serie. 

78. La informacion siguiente corresponde al precio de un articulo en los ultimos cinco anos. La serie 
se da en bimestres 


BIMESTRES 

2007 

2008 

2009 

2010 

2011 

Primero 

$350 

410 

605 

750 

960 

Segundo 

$220 

380 

520 

700 

910 

Tercero 

$200 

360 

480 

650 

870 

Cuarto 

$360 

420 

590 

720 

980 

Quinto 

$450 

580 

760 

870 

1.080 

Sexto 

$620 

750 

880 

1.020 

1.120 


a) Calcular los Indices por los tres procedimientos que se vieron. 

b) Desestacionalizar la serie. 
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En la vida diaria, se va registrando numerosa informacion a medida que se produce, formando 
series en el tiempo. El analisis de estas series trata de describir su comportamiento pasado y 
predecir su comportamiento futuro, de acuerdo con los datos registrados a traves del tiempo. 

Parte del analisis de estas series consiste en descomponer la variable en sus cuatro factores: 
tendencia ariaciones estaciona es tic icas y a eatorias Los componentes mas importantes 
en el analisis de la serie son la tendencia y la aviation estaciona . 

La tendencia describe mediante una linea recta parabo ica e ponencia o de cualquier otro 
tipo, buscando que sea la mejor linea que represente al conjunto de datos. Por lo tanto la linea 
de tendencia podra ser ascendente o descendente. 

Los pronosticos o estimaciones futuras deben hacerse a corto plazo, ya que se considera que 
el comportamiento de los datos sera igual al del periodo de prediccion. Como maximo seria a 
10 anos, lo aconsejable uno o dos periodos. 

Es importante conocer e identificar las fluctuaciones estacionales a fin de poder eliminarlas en 
aquellos casos en que sea posible y necesario. 

La tendencia la podemos determinar por el metodo de los minimos cuadrados; tambien, 
utilizando el metodo de los promedios moviles, mediante el procedimiento denominado 
“mano alzada” o aplicando los promedios moviles, siendo esta ultima una forma de alisar o 
suavizar las fluctuaciones hasta llegar a conformar una linea. 

Como en la regresion que se vera en el Capitulo siguiente, se podra determinar el “error en la 
estimacion”, que permite fijar limites dentro de los cuales estara el valor real con cierto 
grado de confiabilidad. Tambien se podra calcular el coeficiente de correlacion, que determina 
el grado o bondad del ajuste de estimacion. 









CONTENIDO 


Regresion 
Correlation 


■ Terminos, formulas, calculos, 


definiciones, y conceptos generales. 


■ Regresion Lineal, Parabolica y 
Exponencial simple. Limites de 
confianza. 


Si un hombre comien a con certe as 
acabara con dudas pero si comien a 


■ Regresion Lineal, Parabolica y 


Exponencial ponderada. 

■ Regresion y correlacion multiple. 


con dudas acabara con certe as. 


Francis aeon 


Correlacion por Rangos (Spearman). 

■ Pruebas de los Coeficientes de 
regresion y correlacion. 

■ Sintesis de la Unidad. 

■ Ejercicios para Resolver, resueltos en 

al vicfomn /in InTAi^tnoniAn ah T moo 



El estudiante debera estar en capacidad de: 

□ Conocer, entender y aplicar correctamente 
cada uno de los metodos de Regresion y 
correlacion. 

□ Valorar la importancia que tiene la 
Regresion en la toma de decisiones. No 
solo como asignatura, sino en el ejercicio 
profesional. 

□ Calcular e interpretar los resultados, los 
errores de estimacion, limites de confianza 
y Coeficientes de regresion y correlacion. 

□ Distinguir el uso de la correlacion de 
Spearman y la de Pearson. 
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ASPECTOS GENERALES 


En el desarrollo de la mayoria de los capitulos que antecedieron al presente a excepcion del capitulo 
anterior, nos hemos venido refiriendo o analizando unicamente una variable, es decir, se realiza una 
muestra aleatoria con la cual se obtiene informacion para una o varias caracteristicas, que permiten hacer 
inferencias acerca de cada uno de los parametros en forma independiente, denominadas: distribuciones 
unidimensiona es o datos uni ariantes , dado que se analiza cada variable por separado. 

En este capitulo se tendran dos casos. En la primera parte se estudiara la relacion que puede ha- 
ber entre dos variables, analizadas simultaneamente, por tal razon se les clasifica como distribuciones 
bidimensiona es o datos bi ariantes ; en la segunda parte se estaran relacionando mas de dos variables 
simultaneamente y nos referimos a distribuciones p uridimensiona es o mu ti ariantes. 


REGRESION Y CORRELACION 


Son numerosos los ejemplos que se pueden dar al trabajar con dos variables que estan relacionadas: 
produccion y consumo; ingresos y gastos; horas trabajadas y accidentes de trabajo; horas de estudio y 
rendimiento academico, etc. El ejemplo mas comun que lo practicamos diariamente: peso y estatura. 
Pero no basta con disponer de la informacion que ha sido recolectada, es necesario establecer si en 
realidad existe relacion entre ellas, procedimiento que denominaremos como and isis de regresion 
corre acion , para poder estimar una de ellas en funcion de la otra, que suponemos conocida. 

La relacion que puede existir entre dos variables las podemos clasificar de la siguiente forma: 


■ Dependencia causa uni atera . Esta relacion se da cuando una de las variables 
influye en la otra, pero no al contrario. 

■ Interdependencia. Se presenta cuando la influencia entre las dos variables es 
reciproca. Seria un caso de dependencia bi atera . 

■ Dependencia indirecta. Dos variables pueden mostrar una correlacion a traves 
de una tercera ariab e que influye en ellas. 

■ oncordancia. Se presenta en dos ariab es independientes a las cuales se les 
determina la correlacion que puede existir. 

■ o ariacion casua . Cuando la correlacion que se presenta entre las dos variables 
es totalmente casua o accidenta 


La mayor parte de este capitulo hara referencia a casos de dependencia bilateral o interdependencia. 


Regresion: el termino de regresion fue originariamente utilizado por Galton para indicar ciertas re- 
laciones en la teoria de la herencia biologica aunque con posterioridad ha llegado a significar el metodo 
estadistico desarrollado para investigar tales relaciones. 

El and isis de regresion da lugar a una ecuacion matematica que nos permite describir la relacion 
existente entre dos variables. Es decir, obtener una linea “ideal” conocida como linea de regresion, que nos 
describa la relacion o dependencia entre dos variables. 
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Esta linea o funcion matematica, en el caso de una sola variable independiente o explicativa puede 
ser expresada, a traves de una: 


Recta o funcion inea : Y = b 4- c 

Parabo a de segundo grado : Y = a 2 + b + c 

Funcion e ponencia : Y = cb 

Funcion potencia : Y — c b 


Con estas cuatro funciones se puede resolver la mayoria de las situaciones que se nos presentan en 
la vida diaria, sin embargo, vale la pena tener presente que existen muchos mas tipos de funciones, que 
deben ser aplicadas en casos especiales. 

El and isis de corre acion nos describe el grado o fuerza con que se produce esta relacion, para ello 
utilizaremos una medida conocida como coeficiente de correlacion o corre acion de Pearson. 

Asi como e and isis de corre acion permite medir la fuerza de asociacion entre dos variables, 
el and isis de regresion permite la prediccion o sea la estimacion de un valor o promedio de una variable 
denominada dependiente, con base en un valor o promedio supuestamente conocido para la otra variable, 
denominada independiente. 

Hay que tener claridad, que el analisis de regresion, ademas de explicar la relacion entre dos va¬ 
riables, de causa y efecto, nos indica si la relacion matematica puede ser inea parabo ica e ponencia 
etc., ademas, nos permite estimar los valores de una variable, suponiendo conocido un valor de la otra 
variable. 


Antes de iniciar el and isis de regresion recordemos algunos calculos de medidas de posicion y de 
dispersion , indispensable para el desarrollo de este capitulo y que fueron vistas en los primeros capitulos. 


Llamaremos 1? , 3 ,. n los valores observados en la primera variable X y ]? 2 , 3 , ... 

para la segunda variable Y. Se tendra pares de observaciones, de tal manera que para ., se tendra un 
valor 2 corresponded a y 2 , y asi sucesivamente, de esta forma se tendra n pares de observaciones. 


Tabla 12.1 



Para cada variable se podran calcular las medias aritmeticas, las varianzas y 
sus desviaciones tipicas, ademas, se tendra una nueva medida de dispersion, 
denominada co arian a. 

Formulas: 


Medias: 

- X*, 

x = ^ 

y=^y> 


n 

n 

Varianzas: 

v - ' 2 —2 

-me 

v" 1 2 -2 

„2_2>, -W 


x n 

y n 

Desviaciones tipicas: 


s y=Py 
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Ejemplo 1. Supongamos la realization de una investigacion por muestreo aleatorio a 10 empresas, que 
producen un determinado producto, en cuanto al valor de la produccion (miles mill $ anuales) y el costo 
del mismo (miles mill de $). Los resultados fueron: 


Tabla 12.2 Calculo de las Medias, Varianzas y Covarianza en la Regresion. 


PRODUCCION 
(miles mill ) 

COSTO 
(miles mill ) 

- 

i 

10 

3 

18 

5 

12 

4 

16 

5 

22 

8 

36 

12 

30 

10 

32 

14 

26 

12 

12 

3 


Calculemos las medidas (media, varianza, desviaciontipicay varianzapara 
el ejemplo 1). 



^ 2^214 

n 10 

n 10 


„2_ 2>, 2 ~«* 2 _ 5.348-10(21,4) 2 _ ?6g1 


n 

.2 —2 


10 


,2_ IJ, 2 -«J 2 _ 732-10(7,6) 2 _ 1511 
y n 10 


■v, =8,76 

5 =3,93 

y 


a co arian a: se simboliza por co ; m o m . Es una medida de dispersion, a diferencia de las 
varianzas que siempre dan resultados positivos, esta puede ser negativa o positiva. 


Se define como “la media del producto 
de as diferencias entre os a ores 
de a ariab e su media aritmetica 
nos determina a ariabi idad 
conjunta deXyY: 


Zl x t -x)(y t -y) 

n n 


Cov = 


325,6 

10 


= 32,56 



Tambien se puede calcular de una manera mas sencilla y mas rapida: 

Cov = XW_xjj Cov = (21,4) (7,6) =32,56 

n 10 






































CAPfTULO DOCE 

REGRESION Y CORRELACION 


Hay quienes utilizan la co arian a como norma para medir la dependencia inea pero no es lo mas 
indicado, dado que no existe ninguna unidad de medida estandarizada. Se dice, que si la co arian a es 
positiva nos estara indicando una pendiente positiva, es decir, en el caso de una recta esta seria ascenden- 
te, y si por el contrario es negativa la linea seria descendente. Esta presentacion puede ser visualizada. Si 
la mayoria de los puntos se situan en las secciones inferior izquierda y superior derecha, la co arian a 
es positiva; si por el contrario, los puntos se situan en la parte inferior derecha y superior izquierda, es 
indicativo de una co arian a negativa, tal como se puede observar en un diagrama de dispersion 



CALCULO DE LA COVARIANZA UTILIZANDO EXCEL 



Ejemplo 2. En una hoj a de calculo, tecleamos quince (15) pares de observaciones para dos variables, cuyos 
datos fueron seleccionados en forma arbitraria, solo para mostrar como se obtiene la COVARIANZA, 
aplicando Excel. 


Figura No. 1. Muestra de Datos. 
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□ Seleccionamos la ficha DATOS y hacemos CLIC en la opcion ANALISIS DE DATOS. 

□ En la lista que ofrece el menu ANALISIS DE DATOS, seleccionamos la opcion COVARIANZA. 
Aparece el siguiente cuadro de dialogo: 

□ RANGO DE ENTRADA, que en nuestro caso sera A1:B15. 

□ RANGO DE SALIDA, seleccionamos la celda D2. 

En la SEGUNDA PARTE DEL CD que acompana al libro encontrara en conjunto toda la aplicacion del EXCEL a 
la ESTADISTICA, que igual al capltulo 13, ofrece una BASE DE DATOS para trabajar 
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Figura No. 2. Covarianza. 
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□ Finalmente hacemos CLICK en ACEPTAR, obteniendo los siguientes resultados: 


Figura No. 3. Cuadro de Resultados. 
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DIAGRAMA DE DISPERSION 

Los datos de la distribucionbidimensional, anteriormente dada en la tablaNo. 12.2, puede ser representada 
graficamente en un par de ejes coordenados, considerando al eje de las abscisas para la primera variable 
( .) y al eje vertical o de las ordenadas, para los valores de la segunda variable ( .). 

En un p ano cartesiano, se presentan tantos puntos como pares de observaciones se tengan, corres- 
pondiendo cada punto a un par de observaciones; a esta representacion grafica se le denomina indistinta- 
mente: diagrama de desparramiento de dispersion de esparcimiento o nube de puntos. 

El problema consiste ahora en unir varios puntos de ese conjunto o nube de puntos, mediante una 
linea ya sea recti meo parabo ico e ponencia o cualquier otro tipo que represente al conjunto. En al- 
gunos casos esos puntos estaran condensados alrededor de ella, en otros presentara dispersion pequena 
o grande; en este ultimo caso se pueden producir grandes errores, como consecuencia de que el ajuste 
realizado no sea el mas indicado. El tipo de linea que se relaciona, dependera de la forma que asuma el 
conjunto de puntos al hacer la respectiva grafica, siendo esta una de las maneras de visualizar mejor; 
tambien de acuerdo a la experiencia del estadistico se puede determinar, cual debe ser mejor ajuste, ya 
sea mediante el metodo grafico (mano a ada) o el ana itico. 

Lo malo de el metodo grafico , es el del ser muy subjetivo, por lo tanto, el resultado dependera de la 
persona que haga el analisis. 

Una vez elaborada la grafica surgen los siguientes interrogantes: 

iQu e linea se va a dibujar?, Recta?, Curvilinea?, Exponencial?... El criterio tecnico y la experiencia 
seran de buena ayuda, pero se deben tener en cuenta algunos aspectos: 


Grafica 12.1 Nube de puntos o Diagrama de dispersion. 
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APLICACION DE EXCEL EN LA ELABORACION 

DIAGRAMA DE DISPERSION 

Tal como procedimos en la elaboracion de GRAFICAS (ver pagina 101), se procedera a realizar la 
GRAFICA DE DISPERSION, utilizando para ello la informacion de los 15 pares de observaciones, con 
las cuales calcularemos la COVARIANZA y el COEFICIENTE DE CORRELACION (ver paginas 576 
y 586). Recordando los pasos utilizados anteriormente en la elaboracion de Graficas, se tiene: 

□ Activamos las CELDAS que contienen la informacion de las dos variables incluidos TITULOS y 
ROTULOS 

□ Procedemos a hacer CLICK sobre la pestana del grupo Graficos en el menu INSERTAR y 
seleccionamos el TIPO DE GRAFICO, en este caso, el de DISPERSION, seleccionando el 
primero (1) dentro de las cinco (5) posibilidades que ofrece Excel. 



Figura No. 4. Insertar Grafico. 


Libro3 - Microsoft Excel 

Insertar Diseno de pagina Formulas Datos Revisar Vista 


□ oiP S3 

Q a Iff 23 


Tabla Tabla 

dinamica w 

Tablas 

s 

Imagen 

BS1 Formas - 

SB ^ 

SmartArt 

Imagenes 

predisenadas ^ ^aptura - 
Ilustraciones 

£ tty Linea » ^ Area 7 

<ift Circular * Dispersion T 

Columna 

- Barra ’ 0 Otros ’ 

Graficos Q 

£v Linea 

Jk Columna 
|2+/- 
Minigraficos 

Segm 

Filtro 

Q 

Hipervinculo 

Vinculos 

h i t 

Cuadro Encabez. 
detexto piepag. 

Texto 

n 

Simbolos 

E29 

• 

* 







E * 

B 

C D 

J I L F 6 

H 

1 

1 i 

1 « 1 

L *1 



n^Hojal Hoja2 HoJaS^tT 




UL 


n'ni ioo %q -o © 


[Iaplicacionese... 


I AP 618 - Paint f jjgl Colombia.com -... !| ^Olimpica Stereo ES (jJVJ 14:38 


□ Observemos el grafico denominado DIAGRAMA DE DISPERSION o nube de puntos, el cual 
permite visualizar el tipo de linea que mas ajusta a ese conjunto de puntos. 
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FiguraNo. 5. Resultados Grafico de Dispersion. 
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REGRESION Y CORRELACION LINEAL 


Generalmente en el analisis de regresion se utiliza la inea recta por su simplicidad en el calculo 
matematico, ademas, en muchos casos de la vida real nos proporciona aproximaciones suficientes para 
ser aceptada. El modelo matematico que describe una relacion lineal cuando se estima el valor de y en 
funcion de X esta representado indistintamente por: 


Y = bx + c ° Y = Bx + c ° Y = p l x + p 0 6 Y = px + A 


En las anteriores ecuaciones encontramos cuatro componentes: 


■ Y es la variable que se va a estimar en funcion de otra variable (X) supuestamente 
conocida. Se le denomina tambien como ariab e dependiente , explicada o 
predictando. 

■ es la variable cuyo valor que supuestamente se conoce. Se le denomina ariab e 
independiente , predictor o e p icati a. 

■ b = B = fi es la pendiente , la que nos determina el angulo de inclinacion de la recta. 
Denominada tambien coeficiente angular , que nos permite cuantificar la cantidad 
que aumenta o decrece Y, por cada valor que toma la variable independiente (X) o 
explicativa. 


El coeficiente angular puede ser representado de las siguientes formas: 


Figura 12.2 Representacion del coeficiente angular o pendiente 



Si b es un valor mayor que 0, es decir positivo, nos indicara que la recta es ascendente; si b es menor 
que 0 la recta sera descendente y, si b es igual a 0 sera una paralela al eje horizontal. 


■ A = = J3 0 son simbolos que se utilizan para indicar el coeficiente de posicion u origen en la 

ordenada. Se dice que es un punto localizado en el eje de la ordenada, factor constante que se 
incluye en la ecuacion, siendo igual a Y cuando = 0. El coeficiente de posicion puede ser 
mayor, menor o igual a 0, como se puede observar en las siguientes figuras. 
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Figura 12.3 Ubicacion del coeficiente de posicion 
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En el primer caso sera un punto por encima del origen, en el segundo pasara por el origen y en el 
tercero estara por debajo del origen. 

Ajuste de una recta 


Figura 12.4 Ajuste de una recta 



En el desarrollo de este capitulo, utilizaremos letras minusculas bye para simbolizar los coeficien- 
tes de regresion, dado que en general las letras mayusculas y o las letras del alfabeto griego /i, y fi Q 
sirven para simbolizar parametros , es decir, coeficientes de regresion poblacionales y no muestrales, 
como es el objetivo de este tema. 

El problema ahora consiste en calcular los coeficientes de regresion muestrales, que son estima- 
dores de los parametros o coeficientes de regresion poblacional. En la practica, la dificultad radica en 
determinar el criterio que nos sirva para definir el “mejor ajuste ”, es decir, la mejor linea que represente 
al conjunto de puntos. 

Esa es la razon de hallar los valores de b y c de modo que Y. sea lo mas cercano posible a los va- 
lores observados de ., para ello el procedimiento de calculo mas indicado es e metodo de os mmimos 
cuadrados. 
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Metodo de los mmimos cuadrados 

Es un metodo preferido de estimacion, por el cual las cantidades a estimar son determinadas, minimizando 
la suma de los cuadrados de las diferencias entre los valores observados ( ) y los valores estimados Y 

X = 2 ( ~ Yi ) 2 — mmimo 

e es considerado como el error que se puede cometer en la estimacion, el cual debe ser minimo 
frente a otros modelos, para que proporcione una buena representacion de esos puntos por la linea de 
regresion establecida. Es de importancia o de preferencia en dos casos: 


■ (a) Cuando se buscan estimadores lineales con varianza minima (ver teorema de 
Gauss Markoff). 

■ (b) Cuando el modelo implica errores normalmente distribuidos y la estimacion 
por mmimos cuadrados llega a ser equivalente a la estimacion por maxima 
verosimilitud. 


Procedimiento de calculo de los coeficientes de regresion bye (y /? 0 ) 

De acuerdo con la ecuacion general de la recta Y = b c, en la cual tenemos como incognitas (b y 
c), requiere para su solucion de dos ecuaciones normales; para ello obtenemos la primera ecuacion 
anteponiendo a cada termino el signo de la sumatoria. La segunda ecuacion se logra multiplicando la 
ecuacion general por , es decir, = b 2 + c y luego se les antepone el signo de la sumatoria. 

En el desarrollo de las dos ecuaciones, es conveniente recordar las propiedades de la sumatoria. 


Reemplacemos en las dos ecuaciones, utilizando la informacion obtenida en el ejemplo 1: 

0 (!) I = A2>,+«A> ~| 

(2)12>,*,=AI>, 2 +A>XyJ 

Mediante algunos de los metodos que usted conoce (sustitucion, igua acion o e iminacion), encon- 
trara los valores correspondientes a b y c. 

'Ey, =76 X x t -214 X x f = 5.348 '^x,y l =l.952 

(1) 76= 214b + 10c 

(2) 1.952 = 5.348b + 214c 

Procedemos a multiplicar la ecuacion (1) por -21,4 y luego se la restamos a la ecuacion (2), de esta 
manera: 

(2) 1.952 = 5.348b +214c 

(1)-1.626,4 =-4.579,6b - 214c 
325,6 = 768,4b 

Despejamos el valor de b = = 0,4237 

v J 768,4 


(1) Xj, =6X x , +wc 

( 2 ) X y , x ,= x , 
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Ahora, conociendo el valor de b o , reemplazamos en ecuacion (1), asi: 

(1)76 = 214(0,4237)+ 10c 
76 = 90,6718 + 10c 

Siendo C = 76 ~^ 6718 = -1,4672 

NOTA: con el uso de la calculadora los resultados son b = 0,4237 y C = -1,4679, eso se debe al 
trabajar con todos los decimales. 


Veamos otras formulas que nos permitan operar mas rapido y sencillo, que trabajando con un siste- 
ma de ecuaciones normales tal y como lo acabamos de realizar. 


Cov 


b = 3Z56 = 37 

76,84 


« X +- Q >,) 2 


b _ 10(1.952)-(214) (76) _ 3.256 _ Q ^ 
10(5.348)-(214) 2 7.684 ’ 


h= J i x^y 1 -nxy_ 

U 2 -2 
2 J x f -nx 


_ 1.952-10(21,4)(7,6) _ 325,6 
5.348-10(21,4) 2 768,4 ’ 


b = 


ZC Xj-xHyj-y) 


-x) 


b = 325,60 =Q4237 
768,40 


Como se puede observar con la aplicacion de las formulas anteriores, se obtienen exactamente los 
mismos resultados para b 6 /? 1? siendo de 0,4237. Ahora veremos como se abrevia el calculo de c 6 fl Q . 


.x 


c = 76-0,4237(214) = _ 14672 


c-y- bx 


c =7,6 - 0,4237(21,4) = -1,4672 


Prediccion o estimacion puntual 

Se podra decir que una de las finalidades, al establecer la funcion que represente adecuadamente 
al conjunto de pares de observaciones que se han tornado para el analisis, es el de poder realizar 
interpo aciones, ya que no es indicado para hacer e trapo aciones. Lo anterior significa, que si se va 
a predecir o estimar el valor de Y, se requiere que el valor de (variable independiente) deba tomar 
un valor que se encuentre en el rango de dicha variable y no un valor que sea superior o inferior a los 
limites que tenga el rango poblacional. Por ejemplo en el ejercicio 1, se senala una produccion, que 
en la muestra va desde 10 hasta 36 (miles de millones de pesos), lo mismo en cuanto a la variable 
costo va de 3 a 14 (miles de millones de pesos), siendo posible, que en algun momento estos rangos 
sean ligeramente superiores en la poblacion, esto hace que al elegir el valor que toma la variable 
independiente para hacer la estimacion, este debera estar en el rango poblacional, y nunca por fuera 
de el, pues dejaria de ser una interpo acion y pasaria a una e trapob acion Se puede decir, ademas, 
que no es suficiente lo anterior, sino tambien deben tenerse en cuenta las condiciones con las cuales se 
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definio la unidad o el elemento de la investigacion, a fin de conocer la poblacion de la cual se extrajo 
la muestra aleatoria. 

Obtenidos los valores para los coeficientes by C, se reemplazan en la ecuacion general de la recta, 
asi: Y = 0,4237 - 1,4672 


Ejemplo 2. /,Cual seria el costo (estimado) en miles de millones de $, para una fabrica que desea tener 
una produccion por un valor de $24 (miles de millones)? 


Y =b +c 


Y = 0,4237(24) — 1,4672 = 8,7 miles de millones de pesos 


Se estiman los costos en 8,7 miles de millones de pesos, para una produccion de 24 miles de millo¬ 
nes de pesos. 


Esta misma estimacion la obtenemos mediante la ecuacion 


Y=b( --) + 


Veamoslo: Y = 0,4237(24 — 21,4) + 7,6 = 8,7 miles de millones 


I3i\ ANALISIS DE REGRESION 


Nuevamente consideramos los 15 pares de observaciones (ejemplo 2 de la pagina 577) lo utilizaremos 
para el and isis de regresion , empleando para ello EXCEL, de la siguiente manera: 

□ Seleccionamos la ficha DATOS, y luego hacemos CLIC en la opcion ANALISIS DE 
DATOS. 


Figura No. 4. Insertar Grafico. 
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Figura No. 6. Analisis de Datos. 
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□ En el cuadro de dialogo que aparece, seleccionamos la opcion REGRESION y tecleamos lo 
siguiente: 

□ RANGO Y DE ENTRADA, seleccionamos B1 :B15. 

□ RANGO X DE ENTRADA, seleccionamos A1:A15 

□ Finalmente se debe fijar el RANGO DE SALIDA, en este caso sera la celda D2, luego hacemos 
CLIC en aceptar con lo cual obtenemos la informacion del ANALISIS DE REGRESION 
LINEAL SIMPLE. 

□ El anterior procedimiento permite calcular los COEFICIENTES DE REGRESION, B q y B 1? 
ademas el COEFICIENTE DE CORRELACION y DE DETERMINACION DE PEARSON, 
asi como las VARIANZAS DE LAS VARIABLES, X y Y. 

Coeficiente correlacion 

r = 0,77 R 2 = 0,5975 n= 15 

c = p o = 50,157; p 1= b = 0,8476; Y = 0,8476x+50,157; =49,977; s xy = 7,069 


En la SEGUNDA PARTE DEL SIL, encontrara en conjunto toda la aplicacion del EXCEL a la ESTADISTICA, que igual al 
capltulo 13, ofrece una BASE DE DATOS para trabajar. 
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Figura No. 7. Regresion. 
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Figura No. 8. Cuadro de Resultados. 
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Varian a residual y error estandar de estimacion =5- VR = S 2 

La arian a residua arian a no e p icada o la suma de os cuadrados de error son los nombres 
que se emplean para identificar a esta medida de dispersion, que permite calcular el grado de variacion 
o de dispersion que presenta el conjunto u observaciones que no quedaron explicados por la recta de 
regresion. Es decir, la dispersion de aquellos valores que no quedan dentro de la recta establecida para el 
conjunto de observaciones. 


Se define como a media aritmetica de cuadrado de as diferencias entre os a ores obser ados 
os a ores estimados. Las formulas que se emplean para su calculo son varias, entre las cuales 
tenemos: 


(1) 


,2 

n 


( 2 ) 


St, = V 

yx y 


2 m *y 


(3) 


2 0 2 


s: r =s -2bm„ +b s 

yx y xy 


(4) 


c 2 


n 


(5) 




:S 2 J1-R 2 ) 


Veamos ahora la aplicacion de cada una de estas formulas: 


z 

y - y , 

( y -^) 

2,77 

0,23 

0,0529 

6,16 

- 1,16 

1,3456 

3,62 

0,38 

0,1444 

5,31 

- 0,31 

0,0961 

7,85 

0,15 

0,0225 

13,79 

- 1,79 

3,2041 

11,24 

- 1,24 

1,5376 

12,09 

1,91 

3,6481 

9,55 

2,45 

6,0025 

3,62 

- 0,62 

0,3844 

76,00 

0,00 

16,4382 



i) L 


16,4382 

10 


1,64 


2 ) 

3) 

4) 


^2 44 _ 32^56^ _ ^ ^ 

^ °’ 44 76,84 1,(54 

s\ x =15,44 — 2(0,4237)(35,56) + 0,4237 2 +(76,84) = 1,64 
2 732+ 1,4672(76)-0,4237(1.952) 16,4448 . ,, 

‘ v » = -To-io~ = 1 ’ 64 


5) S 2 yx = 15,44(1 - 0,8938) = 1,64 


Observemos los resultados anteriores de la VR ( arian a residua o no e p icada), son iguales, 
salvo en la ultima que nos dio una pequena diferencia que no debe preocupamos, pues generalmente 
trabajamos con dos decimales, lo cual altera un poco el resultado. 
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Error estandar de estimacion 


Es una expresion dada a la desviacion estandar de los valores observados respecto a una linea de 
regresion. Se podria decir que es una estimacion de la variacion que probablemente acompanara 
a las predicciones realizadas por medio de la ecuacion de regresion. 


Se define como la raiz cuadrada de la varianza residual. 



En el ejercicio que hemos venido desarrollando sera igual a s = -^1,64 = 1,28 


Intervalo de prediccion o de estimacion 

El inter a o de prediccion o Umites de confianza para un valor estimado ( Y ), consiste en establecer 
dos puntos para el estimador, dentro del cual debe estar contenido el parametro o valor estadistico de la 
poblacion, con cierto grado de confianza o de seguridad, que sera establecido por el analista o estadistico. 
Se consideran dos formas de calcular estos intervalos, segun se vaya a estimar (a) un a or de a ariab e 
y (b) un a or promedio. La diferencia en cada caso dependera de como se considere a (X), ya sea 
un valor de la variable o como un valor promedio para esa misma variable. Veamos cada calculo del 
estimador en forma separada, con los mismos datos del problema anterior. 


En el primer caso , cuando a la variable independiente (X) se le da un a or que debe estar dentro 
del recorrido de la variable poblacional, y se desea estimar la variable dependiente ( Y), la formula que 




1+ 

1 

1+!+ , 

n 


Suponiendo que se quieren establecer los limites de confianza del 95%, en el ejercicio en que se 
desea estimar cual debe ser el costo en funcion de la produccion, cuando = 24 (valores dados en miles 
de millones de pesos), para las 10 empresas seleccionadas en la muestra. 


7 = 8,7 ±2,306 (1,28) 


, 1 (24-21,4) 

1 + — + — ' 


10 5.348-- 214 *" 


-> Y = 8,7 ±3,11 


10 


Y = 11,81 (miles de millones de pesos) 
Y t =5,59 


Dentro de esos valores (11,81 y 5,59), debera estar el valor verdadero, con una confianza de que asi 
sea, del 95%; nos queda un margen del 5% que este por encima o por debajo de esos valores. Observe 
que el error que podemos cometer en la estimacion es relativamente grande siendo de 3,11, resultado 
logico cuando la muestra seleccionada, como en este caso, es muy pequena, obteniendose un intervalo 
de confianza muy grande que nos hace desconfiar un poco del procedimiento utilizado. El error se dismi- 
nuye a medida que aumentamos el tamano de la muestra. 


El segundo caso, cuando el valor de se establece como promedio. En el ejercicio que estamos 
desarrollando (estimar costo en funcion de la produccion) se aplicara la siguiente formula: 
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Y + t n _ 2 S yx ^ 


I + - 


( x-x ) 2 


2>, 2 


(X *,) 2 


Reemplazando con los datos obtenidos en el ejercicio respectivo se tendra que: 

[9,67 


7 = 8,7 ± 2,306(1,28) 


J_ (24 - 21,4) 

l^ + 5.348 -^ 
I 10 


7 = 8,7 ±0,97 = 


7,73 


(miles de millones de pesos) 


Dentro de esos limites (7,73 y 9,67) estara el valor real (costos), con una seguridad del 95% 

Varian aexplicada =VE 


Hasta el momento se han calculado las varianzas para la variable y (S 2 y S 2 ), denominadas: 
arian a tota de y arian a tota de . Tambien se han calculado los valores para la arian a no 
e p icada o arian a residua (S 2 ). Ahora nos ocuparemos del calculo de otra varianza, de gran utilidad 
en el analisis de regresion, conocida como arian ae p icada , simbolizada por S 2 . 

a arian ae p icada es una medida que nos permite calcular el grado de dispersion de aquellos 
valores que quedaron explicados por la recta de regresion, es decir, la dispersion de aquellos 
puntos en la grafica que se confunden con los puntos de la recta o valores estimados. 


Se define como la media aritmetica, de os cuadrados de as diferencias entre os a ores estimados 
a media aritmetica de esa ariab e. Su formula es: 

V n 

Es necesario saber que la varianza total debe ser igual a la suma de la Varianza residual mas la 
Varianza explicada: VT = VR+ VE . De acuerdo con dicha igualdad se tendra que VE = VT- VR . Pro- 
cedemos a calcular esta medida de dispersion en el ejercicio que hemos venido desarrollando: 


Z 

Y,-y 

( Y-yy- 

2,77 

- 4,83 

23,3289 

6,16 

- 1,44 

2,0736 

3,62 

- 3,98 

15,8404 

5,31 

- 2,29 

5,2441 

7,85 

0,25 

0,0625 

13,79 

6,19 

38,3161 

11,24 

3,64 

13,2496 

12,09 

4,49 

20,1601 

9,55 

1,95 

3,8025 

3,62 

- 3,98 

15,8404 

76,00 

0 

137,9182 



Reemplacemos los resultados anteriores en las formulas que se dan para calcular la varianza 
explicada: 
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(1) s 2 = — = 137 ’^ 182 = 13,79 (2) VE = VT - VR 

■ n 1U 

,9 2 = S 2 - S 2 

ay y yx 

S 2 y = 15 , 44 - 1,64 = 13,80 

Observemos que los resultados obtenidos, mediante las dos formulas senaladas, son iguales. 

La interpretacion que se les da a las varianzas tota , residua yep icada es: la primera determina 
la dispersion de todos los puntos o pares de observaciones representados en la grafica o diagrama de 
dispersion ; en la segunda, la residua se reduce a determinar la dispersion en los puntos o pares de obser¬ 
vaciones que no quedan sobre la linea de regresion, elaborada con los valores estimados; y en la tercera, 
la varianza e p icada solo toma en cuenta, los puntos u observaciones que quedan ubicados sobre la recta 
de regresion. 




. ' •* 

/ 


VT = Varian a Total 

VR = Varian a Residual 

YE = Varian a Explicada 


Coeficiente de correlacion o de Pearson =^> R = r 


Comentabamos al iniciar el tema sobre analisis de regresion y correlacion, lo que se entendia por regresion 
y por corre acion. En este ultimo deciamos que nos determinaba el grado de relacion que puede haber 
entre las dos variables. Este grado de correlacion lo obtenemos mediante el calculo del Coeficiente de 
corre acion 


El coeficiente de correlacion es una medida de interdependencia de dos variables aleatorias. 


En primer ugar nos referiremos al calculo del coeficiente de correlacion al cuadrado denominado 
tambien como coeficiente de determinacion, simbolizado por R 2 Las formulas para el calculo de este 
coeficiente son variadas, obteniendose un resultado igual por cualquiera de los metodos que se utilice. 
Veamoslo: 


( 1 ) 

( 2 ) 



9 

R 2 =^t 


32,56 2 


S 2 S 2 

L, x LJ y 


(76,84) (15,44) 


= 0,8936 = 0,89 


R 2 =-2i = 1 | 4 t = 0,8931 = 0,89 
S 2 15,44 

> 

R 2 = 1 - = 0,8938 = 0,89 

15,44 


( 3 ) 
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El coeficiente de correlation al cuadrado debe ser un valor tal, que cumpla con la siguiente 
condicion: 0 < R 2 < 1 . Cuando el coeficiente de correlacion al cuadrado es igual a 1, decimos que hay 
una corre acion perfecta, ya que los valores observados son exactamente iguales a los estimados, en 
otras palabras, los puntos en una grafica (nube de puntos) se confunden con los de la recta; se dice 
en este caso, que la arian a e p icada es igual a la arian a tota . A medida que el coeficiente de 
correlacion al cuadrado disminuye, se aleja de uno, se dice tambien, que la recta representa cada vez 
menos a ese conjunto de observaciones. Un R 2 < 0,30 nos estara indicando que no hay correlacion 
entre las variables. 


De acuerdo con la formula presentada en al pagina anterior (2) podemos decir, que el coeficiente 
de corre acion a cuadrado o coeficiente de determination mide la proporcion de la varianza 
que queda explicada por la ecuacion de regresion, que describe la relacion establecida entre las 
dos variables. Se podria decir, en otras palabras, que indica el porcentaje de las variaciones de la 
variable dependiente, atribuible a la influencia de la variable independiente. 


En segundo ugar nos podemos referir simplemente al coeficiente de correlacion , en este caso de 
una recta, el cual se simboliza por r 6 R. Se define como la ralz cuadrada del coeficiente de determina¬ 
tion. El signo del coeficiente dependera del signo que tenga la covarianza o los coeficientes angulares 
(estos ultimos deben tener el mismo signo y el producto debe ser menor o igual a uno). 

Su calculo se puede realizar mediante la aplicacion de diferentes formulas, obteniendose exacta¬ 
mente el mismo resultado. Siendo: 


( 1 ) 

( 2 ) 

( 3 ) 



r = 4¥ 


32,56 

(8,76) (3,93) 


= 0,9458 = 0,95 


r = VO,8938 = 0,9454 = 0,95 


V — 

nZy,x, - (Ex,) (E^) 

V 

[«Ex, 2 -(Ex,) 2 ] 

kv 2 -(£y,) 2 ] 



_ 10(1.952) ~(214)(76) _ 

yj [l 0(5.348) - (214) 2 ] [l0(732) - (76) 2 ] 


= 0,9452 = 0,95 


(4) 



1.952-10(214)(7,6) 

J [5.348-10(214) 2 ] [ 732 - 10 ( 7 , 6 )’] 


El coeficiente de correlacion debe ser un valor comprendido entre -1 y 1, por lo tanto se dira 
que: — 1 < r < 1 . a re acion sera perfecta cuando r es igual a 1 o -1; no hay ninguna relacion 
cuando r = 0, 6 menor a 0,30. 


Sabiendo que el coeficiente de correlacion sera un valor — 1 < r < 1 , se representara, asi: 
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Figura 12.5 Comportamiento del coeficiente de correlacion 



El grado de corre acion lo podemos clasificar tentativamente, evitando un tanto la rigidez de sus 
limites. 


■ Correlacion perfecta, cuando r = 1 

■ Correlacion e ce ente , cuando T es mayor de 0,90 y menor de 1 

■ Correlacion aceptab e , cuando V se encuentra entre 0,80 y 0,90 

■ Correlacion regu ar , cuando T se encuentra entre 0,60 y 0,80 

■ Correlacion minima , cuando r se encuentra entre 0,30 y 0,60 

■ No ha correlacion para V menor de 0,30 y mayor a 0 


r = — 1 
( —1< r < —0,90) 
( —0,9< r < -0,8) 
( —0,8< r < -0,6) 
( —0,6< r < -0,3) 
(-0,3 < r < 0) 


No debemos confiarnos del resultado obtenido, en especial cuando es bueno o muy bueno, mientras 
no estemos seguros de que las variables tienen una relacion de causa y efecto, pues podemos obtener una 
buena correlacion entre dos variables, lo cual puede deberse a la casualidad; por ejemplo un coeficiente 
de 0,86 entre las variables: asistencia diaria a clases (de lunes a viemes) y el precio del cafe en esos 
mismos dias. 

Como complemento al analisis de regresion, se puede aplicar la prueba de hipotesis al coeficiente 
de regresion y al coeficiente de correlacion. 
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~ CALCULO DEL COEFICIENTE DE CORRELACION 

CON APLICACION DE EXCEL 



Con los mismos datos de la tabla (ver pagina 577), que aparece en la hoja de calculo, procedemos a 
calcular el COEFICIENTE DE CORRELACION (r) de la siguiente manera: 


□ Con los mismos datos de la tabla (ver pagina 616), que aparece en la hoja de calculo, procedemos 
a calcular el COEFICIENTE DE CORRELACION (r) de la siguiente manera: 

□ En la ficha DATOS seleccionamos la opcion ANALISIS DE DATOS. 


Figura No. 9. Analisis de Datos. 
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□ Seleccionamos de la lista que nos ofrece el cuadro de dialogo ANALISIS DE DATOS, la opcion 
COEFICIENTE DE CORRELACION y hacemos CLIC en ACEPTAR. 

□ Tecleamos en el campo RANGO DE ENTRADA siendo A1:B15; luego en el RANGO DE 
SALIDA senalamos una CELDA de la hoja de calculo, en nuestro caso, sera la celda D3. 
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□ Finalmente hacemos CLIC en ACEPTAR tal como aparece en las aplicaciones que se presentan 
a continuacion: 
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FiguraNo. 10. Calculo del Coeficiente de Correlacion. 
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FiguraNo. 11. Cuadro de Resultados. 
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□ Tomando los resultados del ejercicio anterior (ver pagina 577) junto con los resultados del 
ejercicio que estamos desarrollando, es posible observar lo siguiente: 
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Figura No. 12. Comparacion Cuadro de Resultados de los Dos Ejercicios Anteriores. 
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□ El coeficiente de correlacion o coeficiente de correlacion de Pearson es: 
r = 0,20 o = 34,67 S' 2 = 103,29 S 2 = 289,71 

PRUEBA DEL COEFICIENTE ANGULAR O COEFICIENTE DE REGRESION /3 6 b 

La pendiente estimada b se halla sujeta a la variabilidad muestral, por lo tanto, en algunos casos puede 
ser un mal estimador y por consiguiente, la ecuacion de regresion no tiene validez como elemento de 
prediccion. Tambien se debe tener en cuenta el tamano de la muestra para utilizar la prueba de “Z ” o 
de ‘7” en este ultimo caso se debe considerar n - 2 grados de libertad, por ser dos variables, las que se 
constituyen en medidas muy generales de significacion y confianza. 

Siendo b, la pendiente muestra y /?, la pendiente pob aciona , se puede considerar como hipotesis 
nula (H ) cuando el coeficiente angular es 0, frente a la alternativa que sea mayor, menor, o diferente de 
cero, pudiendo decir, que la recta de regresion es util para estimar la variable dependiente (7). Siendo 
la variante estadistica de ‘7” igual a: 


donde: 


Sb l , es el error estandar del coeficiente de regresion b , es decir, una medida de la cantidad de error 
muestral que puede haber en el coeficiente b de la ecuacion de regresion de la recta, en este caso, se 
tendra que: 



e — c 

1 


£(x,-x) 2 
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Ahora teniendo que: 


s i, 



0,046 


a) H 0 : ySj =0 (No hay relation) 

H a : ^ 0 (Si hay relation) 

b) oc = 0,05 

c) b = 0,4237 


0,4237-0 

0,046 


= 9,21; 


v = 10-2 = 8l 
oc=0,05 J 


t = 2,306 



-2,306 2,306 


d) Cuando t es menor que t n2 se acepta la hipotesis nula, en caso contrario, cuando es mayor, se 
acepta la hipotesis altemativa. En este ejemplo aceptamos H , por lo cual podemos llegar a la 
conclusion de que la recta de regresion constituye una ayuda para estimar la variable dependiente. 
Observe que en este ejercicio se esta rechazando la hipotesis nula H Q , y aceptando la hipotesis 
alternativa H . 

a 


En conclusion se podra decir, que si se rechaza la hipotesis nula se debe a que hay relacion lineal. 
En este caso concreto, hay relacion entre las variables produccion y costo, llegariamos a la conclusion de 
que existe una relacion significativa. 


Un segundo procedimiento para realizar la prueba del coeficiente angular, a fin de probar la exis- 
tencia de una relacion lineal entre estas dos variables sometidas al analisis, se hace estableciendo un 
internalo de confianza para determinando si el valor hipotetico dado H 0 : = 0 se encuentra incluido 

dentro del intervalo. Si esto sucede llegariamos a la conclusion de que no hay relacion, si por el contrario 
el valor de fi cae por fuera de estos limites, significa que hay cierta relacion entre las variables. 


b x ±t n _ 2 S hl = 0,4237±2,306(0,046) = 0,4237 + 0,1061 


JO,5298 = 0,53 
[0,3176= 0,32 


Ambos limites son positivos, por lo tanto no admite o no incluye el cero, es decir, la hipotesis nula 
no cae dentro del intervalo y se estara aceptando la alternativa, es decir, que si puede haber una relacion 
de causa y efecto entre estas dos variables. 


PRUEBA DEL COEFICIENTE DE CORRELACION r 

Ademas de las dos pruebas anteriores, existe otro procedimiento mas para establecer si hay relacion 
lineal, siendo esta la prueba al coeficiente de correlacion obtenida en la muestra. Para ello se considera 
que p = 0 (letra griega que se lee rho), es decir, que el coeficiente de correlacion en la poblacion es igual 
a cero, frente a la alternativa de que sea diferente; para ello se tendra que: 


_r- _ — _ g^ip 

l-r 2 1-0,89 
n-2 V 10-2 


Nota: Se puede ampliar estos conocimientos consultando el Capitulo 9 
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La prueba se realiza, al igual que las anteriores, cuyo procedimiento a seguir sera: 

a) H Q : p = 0 (No hay correlation) 

H a '. p 0 (Si hay correlation) 

b) OC = 0,05 

t = 2,306 RC ZA RC 

-1-1- t 

Se observa que 8,10 se situa en la zona -2,306 2,306 

de rechazo, es decir, que hay correlacion entre las variables de la poblacion, lo que equivale 
a concluir, que al nivel de significacion del 5% la correlacion en la poblacion es diferente a cero. 

Suposiciones en el analisis de la regresion 

Son las suposiciones que se deben hacer en el analisis de regresion, entre las principales se tienen: (a) 
Norma idad, (b) Homoscedasticidad y (c) Independencia de error. 


c) 

d) 



a) Norma idad : se supone que los valores de Y tengan distribucion normal en cada valor 
deX. 

b) Homoscedasticidad : es otro supuesto, en el cual la variacion en tomo a la recta de 
regresion es constante para todos los valores de X , no importando que el valor que toma 
sea alto o bajo; de todas formas la variacion se supone es la misma. 

c) Independencia de error, establece que el error estandar de estimacion es independiente 
para cada valor de X. 


iQUE PASA SI EN VEZ DE ESTIMAR Y , SE DESEA ESTIMAR X" ? 

En la mayoria de los casos, se aplica uno de los dos procedimientos, que presentamos a continuacion: 


Primer procedimiento: consiste en cambiar el orden de las variables, veamos que en el ejemplo 1, 
produccion era variable . y costo la variable ., ahora, costo sera la variable . y produccion la variable 
., una vez realizado el cambio se procede igual tal como se realizo con los datos del ejemplo 1. 


COSTO 

PRODUCCION 

(miles mill ) 

(miles mill ) 

i 

i 

3 

10 

5 

18 

4 

12 

5 

16 

8 

22 

12 

36 

10 

30 

14 

32 

12 

26 

3 

12 


Para abreviar no se hara la tabla de calculo, solo colocaremos 
los resultados de las columnas, cuyos datos seran utilizados 
para ser reemplazados en las diferentes formulas ya vistas: 


n-10 
Ijc, =732 
Xy? =5.348 
3c =7,6 


Lx, =76 
Ly,=214 
lx f y f = 1.952 
y — 21,4 
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r — — n 

Calculo de b y c A y i 

L _ _ J 

(1) 214= 766 +10c 

(2) 1.952 = 7326 +76c 


(2) 1.952= 7326 +76c 

(1) -1.626,4 = -577,66 -76c 
325,6= 154,46 (T~ 


s =iir 2 - 1088 

oi/i i oo 

Reemplazamos en (1): 214 = 76(2,1088)+10c => -^— 1 — = c = 5,373 


«Ix 2 -(Lx,) 2 


6 = 10( L 952)-(76)(214) = g8 
10(732)-(76) 2 


nLx j y i —nxy 


6 = 


v 1 2 —2 

2jc r -nx 


6 = 1-952-10(7,6X21,4) =2aog8 


732-10(7,6) 


6 = ^ 
s 

n X 

=> 

Xv, -bljc. 

n — si i 

L — 

n 

c-y-bx 



6=1141 = 2,1088 

15,44 


214-2,1088(76) 

=> c = -= 5,373 

10 

c= 21,4-2,1088(76) = 5,373 


Ejemplo 2. Con la informacion anterior (ejemplo 1) estime el valor de la produccion (miles de millones 
de pesos), cuando supuestamente los costos de produccion son de 13 miles de millones de pesos, fijando 
limites de confianza. Calcule ademas el coeficiente de correlacion de Pearson. 

Solution: 

Primero realizamos la estimacion de 7 

Y= 2,1088 + 5,373 => 7 = 2,1088(13) + 5,373 = 32,79 (miles mill $) 6 


7=2,1088 (13 -7,6)+ 21,4 = 32,79 => Y = b(x-x) + y 


Ahora procedemos a calcular la varianza residual y la desviacion residual o no explicada: 


S 2 yx =VR = S 2 y (l-r 2 ) 

=> y = 76,84(1 - 0,8936) = 8,18 

0 2 0 2 COV 2 

c 2 

=> 

.V 2 = 76,84 3 , 2 ; 5 , 6 , 2 =8,18 
y 15,44 

( -,2 'Ey 2 -cLy'-bLypC' 

_ c 2 _ 5.348-5,373(214) —2,1088(1.952) 

n 

o 

1 

X 

2 


- 8,18 


Usted podra calcular la VR = =8,18 (aproximadamente) 
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La desviacion residual sera: 5, r 

yx 


= V808=2,86 


Los limites de confianza se obtendran asi: 


7=32,79 + 3,306 (2,86) 

(Valor) 


1 + ^ + J 13 " 7 ’ 6 ) 


10 


732- 


(76) 

10 


= 32,79 + 10,73 


6 7=32,79 + 2,306(2,86) 

(Promedio) 


1 

— + 



(13-7,6f 


732- 


(76) 

10 


= 32,79 + 3,54 


J 43,52 
[22,06 

J 36,33 
[29,25 


Los limites, cuando es un a or o un promedio son 22,06 y 43,52; 29,25 y 36,33 miles millones 
respectivamente, dentro de los cuales estara el parametro (valor poblacional) con una seguridad o con¬ 
fianza del 95%. 


Ahora calcularemos el coeficiente de correlacion lineal o de Pearson, mediante algunas de las for¬ 
mulas ya vistas: 


r — 

n'Lx,y l -{'Lx l )(Xy,) 


[»Lx, 2 -(L0 2 ] 

kv, 2 -(Sy ; ) 2 ] 



_10(1.952)-(76)(214)_ 

-J [l 0(732) - (76) 2 ] [l 0(5.348) - (214) 2 ] 


= 0,95 


y d 818 _ 

r 2 = 1-= 1--— = 0,8936 =>r = J0, 8936=0,95 

VT 76,84 


r 


2 


VE 

VT 


^^ = 0,8936 => r = 0,95 
76,84 


VE = s 2 -sl = 76,84 -8,18 = 68,66 = si 

yy j ‘ j y 

r = 0,95 es un buen coeficiente de correlacion, indicandonos que existe una buena relacion (causa 
y efecto) entre las dos variables. 


La prueba de hipotesis sobre el coeficiente de regresion (b) y el coeficiente de correlacion (r), ten- 
dra un procedimiento de calculo exactamente igual como se hizo anteriormente, antes de intercalar las 
variables. 


E segundo procedimiento , se realiza tal como funciona generalmente el calculo de la regresion, en 
cualquiera de las calculadoras que habitualmente manejamos, pero para ello, utilizamos de ayuda una 
nueva simbologia que espero no cause dificultades al estudiante, pues la primera impresion que se siente, 
es de complejidad, lo cual no es cierto. 

USO DE LA CALCULADORA 

En primer lugar planteamos las dos ecuaciones, dependiendo de la variable que se desea estimar: 
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Cuando se desea estimar la variable Y en funcion de la variable . En nuestro caso 
production en funcion del costo. 


Cuando se desea estimar la variable X en funcion de la variable . En nuestro 
caso costo en funcion de production. 


A1 calcular b , b , c , c , se debera resolver mediante uno de los sistemas de ecuaciones nor- 
males, que a continuacion se presenta: 


6 


(1) ly f =b yx IXj+n c yx 

(2) ly,x, = b yx Yxf +c yx lx, 


(1) lx,=b xy ly,+nc xy 

(2 ) lx i y,=b xy lyf +c xy ly, 


Y = b ys (x — x) + y 
X = b xy y + c xy 
X = b xy (y-y) + x 


Tambien las formulas, que ya fueron aplicadas anteriormente, para hallar el coeficiente angular. 




Para el coeficiente de position seran: 


1 

1 

6 

1 

i 

r 

V 

1 

^ XV 


y n 

C yx=y- b yx X 

6 

C xy= X ~ b xyy 


Estos valores se obtienen en la calculadora de la siguiente forma: 


CASIO fx - 5.000F: primero | MODE R~1 y aparece en pantalla LR (regresion inea ); luego borra- 
mos por si acaso hay informacion asi: | SHIFT 11 DEL 11 EXE | 

Se procede a entrar la informacion asi: \W\ \ SHIFT | |T1 1~3~| |DT| ; luego [W\ \ SHIFT | fTi l~5~| |DT| y 
asi sucesivamente. Es de anotar que antes de oprimir | DATA | 6 |DT| en la pantalla debera aparecer asi 

mu\s\ sin®-. 

La tecla | SHIFT | |T1 equivalente a Q (coma). 


Una vez digitada la informacion, se tendra: 
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n = 10 


j 1 

x = 21,4 

2k, =214 


/ 2 

x o n = 8,7658 

2k, 2 =5.348 

y con 

SHIFT 

// 3 

i °r.-\ =9,24 

Yy] =732 


4 

II 

IPs 

l> 

II 


\ 5 

=3,9293 

> n 

2k, y, =1.952 


6 

,0,-1= 4,1419 


c =-1,4679 
by* — 0,4237 
r = 0,9452 


La ecuacion es: 

Y = 0,4237x - 1,4679 


Digitamos el valor de =24y luego Q y aparecera en pantalla 24 Y le damos | EXE | y aparece el 
valor estimado 8,70 (miles de millones de pesos) como costo. Si en cambio digitamos 13 como costo y 
luego se oprime la tecla \X \y | ENTER] en pantalla primero aparece 13X y luego con | ENTER | se obtie- 
ne 34,14 (miles de millones de pesos), resultados exactamente iguales a los ya obtenidos para el mismo 
ejercicio, ahora mucho mas rapido. 


En cuanto a la co arian a que es igual para las dos ecuaciones se obtendra asi: | SHIFT | [2\ [x*1 [*~\ 
| SHIFT [8l| EXE | igual a 32,56, siendo igual al resultado obtenido por el proceso anterior. Para el calcu- 
lo de la arian a residua o no e p icada de S 2 y S 2 , se obtendran asi: 


S 2 = 5 2 (1 Lr 2 ) 


| SHIFT 

1I51PI [ 

(111 

- SHIFT 9 x 2 

1 ) 1 1 EXE| 

s 2 = s 2 

(1 + r 2 ) 




I SHIFT 

[ 

nn} 

f-l SHIFT f9~| [x 2 ] 

HI [exe] 


En el primero el resultado sera de 1,64 y en el segundo es de 8,18. 


Para determinar el coeficiente de correlacion lineal (r) se deben oprimir las teclas | SHIFT 11~9~| | EXE | 
cuyo valor obtenido sera de 0,9452 = 0,95. Queda por determinar b , para ello partimos de que b (b ) = R 2 
R 2 0 9452 2 

luego b = — = —-= 2,108 y la ecuacion a utilizar sera X = 2,1088 (13 — 7 ,6) + 21,4 = 32 ,78, ya 

b yx 0,4237 

que no se puede hallar con la calculadora en forma directa, sino mediante la aplicacion de las formulas 
que se presentaron anteriormente. 


■ En las calculadoras de otras marcas y modelos se procede asi: 

La fx-350 MS de CASIO se oprime | MODE 11 REG | y luego se selecciona REG oprimiendo H; 
enseguida se selecciona con la tecla [T] Lin (lineal) procediendo a entrar la informacion: | 10 | O [3] ^T| y 
asi sucesivamente. 
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f \ 

La salida de los datos, se hara: con SHIFT [T] aparece I 2 ; con [2] I .y con la tecla H el valor de 

72. Observe la flecha ( ->) en la pantalla, oprima con El REPLAY -> aparece £ 2 , £ ., E . ., operando 
con las teclas [T] [2] [3] luego con | SHIFT | [2] en el primer pantallazo aparece o n o n X cuyos 
valores se obtienen con las teclas [T] [2] [3] respectivamente; con REPLAY -> aparece c n & n _ x y 
las mismas teclas anteriores son operadas; se oprime nuevamente REPLAY aparece A que equivale a C o 
jS Q ; = = b y finalmente r (Coeficiente de correlation ); se procede con REPLAY -> aparece y 

V_____ ) 

Algo mas sobre varian as 



Es el porcentaje de la varianza total, que queda explicada por la 
recta de regresion. 

Porcentaje de la varianza total que no queda explicada por la recta 
de regresion. 


V[, + y]=Sl+Sl+2cov 


V b _ y] = y + S 2 y - 2cm 


Ejemplo 3. De una distribucion de dos variables se conocen los siguientes datos: 

r = 0,90 S =1,20 S = 2,10 ~=5 “ = 10 

a) Obtener el valor de X cuando toma el valor de 40 y el de Y cuando se le da el valor de 30. 

b) Calcular la varianza explicada de en funcion de 


Solution: 


m v 




r(S x )(S y ) = m^ 


0 , 9 ( 1 , 2 ) (2,1)-m xy =2,268 


x y 


= 2 ! 268 = =041 

s; ■ 4,41 


Siendo: 


X = b xv {y-y) + x 


Cuando y = 40 se tendra que: 


X = 0,51 (40 -10) + 5 = 0,51 (30) + 5 = 20,30 


, = m xy = 2,26 

>* s 2 1,44 


= 1,56 


Y = b yI {x-x)+y 


Cuandox= 30 7=1,56 (30-5) + 10=39 + 10 = 49 

b) La arian a residua y la e p icada de se obtendran de la siguiente forma: 

S 2 yx = 4,41—=4,41—3,54=0,87 (0,868333)* (VR) 

sl y = 4,41 - 0,87 = 3,54 (3,541666) * (VE) 



* Resultados usando la calculadora 
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Ejemplo 4. El coeficiente de correlation lineal entre X y Y es 0,60. ^Que porcentaje de la variation total 
queda sin explicar por la ecuacion de regresion? 

Solution: 

S 2 S 2 

0,36 = 1— 2- => -^ = 1-0,36 = 0,64 = 64% 

El 64% de la varianza total queda sin explicar, por la recta de regresion. 

Ejemplo 5. Si en una distribution bidimensional (dos variables) se tiene que: { =10,3; [ _ = 8,1. 

^Cual es la covarianza? 

Solution: 

a) = 4- [y] + 2 m Multiplicamos la ecuacion b) por-1 y la restamos de a) 

b) { _ ] = [z] + [y] - 2 m 

a) 10,3 = [x] 4- [Y] 4- 2m 

b) — 8,1 = - [x] — [y] + 2 m 

2,2 = 0 0 4m ^ m = — o 55 

4 

Ejemplo 6. Cinco ninos de 2,4, 6, 7 y 8 anos pesan, respectivamente, 15, 19, 25, 38 y 34. Se pide hallar: 

a) La recta de regresion minima cuadratica del peso con respecto a la edad 

b) El coeficiente de determination correspondiente. 

* Algunos de los resultados fueron obtenidos mediante el uso de la calculadora . 

Solution: 


R= 1- 



- 27 

T = 5 ’4 
y = i|i = 26,2 


y r 

m x> =——-xy 


m xy =^-(5A) (26,2) = 17,32 




m ;y _ 17,32 
4,64 


b = -22. = — 3,7328 = 3,73 ^ ?—x 2 =-^-5,4 2 =4,64 


n2 _ _ _2 _ 169 

n 5 


7 = 3,73(x-5,4)+ 26,2 



5" 2 =^--j 2 =M!!_ 26,2 2 =75,76 
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1 7 99 _ 9QQ QQ 

b = —— = 0,2286 = 0,23 R 2 = (3,73) (0,23) = „ = 0,85 

A> 75,76 (4,64) (75,76) 

(Hay una pequefla diferencia en los resultados obtenidos, por las aproximaciones hechas) 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

1. Con los siguientes datos: 

£ . = 110 n = 5 £. =1.868 £ 2 =3.156 £.=60 £ 2 = 1.138 

i ii i ii 

Se pide calcular: 

a) El error estandar de estimacion Y. 

b) La varianza explicada de Y 

c) Estime el valor de Y cuando = 80, con un margen de confianza del 95%. 

2. Dos variables tienen las siguientes rectas de regresion minimo cuadratica: 

81+27=1 16 X+ 9 Y= 1. 

Calcular el coeficiente de correlacion al cuadrado. 

3. La linea de regresion de fruta agusanada (Y) y el tamano de la produccion del arbol, en centenas de 
frutas (X) es Y = 64 — 1,4 

Si se sabe que - = 45 S =1,2 S = 10,5 encontrar: 

a) - b) Coeficiente de correlacion c) La linea de regresion de X sobre 

4. De una encuesta sobre presupuestos familiares quincenales, se publicaron los siguientes datos: 
Desviacion tipica de los gastos quincenales = 2.000 cientos de pesos 

Desviacion tipica de los ingresos quincenales = 3.000 cientos de pesos 
Coeficiente de correlacion entre ingresos y gastos = 0,85 

Con base en estos datos, se pide calcular la desviacion tipica de los ahorros, entendiendo por tales 
las diferencias entre ingresos y gastos quincenales. 

5. Dados: r=0,8 S =6 F=7 + 4 se pide calcular S . 

6 . Se ha efectuado un estudio donde se relacionan los puntajes de aptitud con la productividad en una 
industria. Despues de tres meses de entrenamiento del personal, sus postulantes, elegidos al azar, 
obtuvieron los seis pares de puntajes de aptitud y productividad que se indican a continuacion: 


A. PUNTAJE DE APTITUD: 

9 

17 

20 

19 

20 

23 

B. PRODUCTIVIDAD: 

23 

35 

29 

33 

43 

32 


a) i^C ual es la productividad esperada de un trabajador, cuyo puntaje de aptitud fue de 16? 

b) Obtener el coeficiente de correlacion. 

c) El error estandar de estimacion. 

d) Fije con una probabilidad del 95%, la productividad estimada en el punto a). 
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7. De una distribucion bidimensional de frecuencias se sabe, que la recta de regresion minima cuadratica 
de la segunda variable sobre la primera es Y= 73 - 0,6 ; la media de la primera variable es 8, la 
desviacion tipica de dicha variable es 2 y la varianza de la segunda es 9. Calcular el coeficiente de 
correlacion rectilinea y la media de la segunda variable. 

8 . Con los siguientes datos: 

£.= 14.225 £ . =287 £ .=273 £ 2 = 14.911 £ 2 =13.599 n = 8 

i iii i 

a) Calcule el error estandar de estimation de la recta con base en . 

b) Calcule la varianza explicada de la variable Y. 

c) Calcule el coeficiente de correlacion rectilineo. 

d) Obtenga la recta de regresion minima cuadratica de Y con base en . 

9. En 50 matrimonios, se analizo la situation economica por las entradas diarias (miles de $) del 
esposo X y de la esposa Y encontrandose los siguientes estadigrafos: 

- = 6,6 miles de pesos; =20 miles de pesos 5 2 = 30 S 2 = 60 m = 8,4 

En las condiciones anteriores, ^que entradas diarias le corresponden a la esposa de un senor que 
gana en un dia $28.000,oo? 

10. De una tabla de correlacion se han calculado los siguientes datos: 

b xy =- 0,2 R 2 = 0,9 S 2 = 8 x = 2 

Se pide calcular la varianza de la suma de dos variables. 

11. Si 5=3 5=5 Hallar el valor de r. 

r x > 

12. Conteste si son ciertas o falsas las siguientes relaciones: 


a) m xy =10 

s x ~ $ 

V= 8 

< =4 

b) b yx = 0,95 

<N 

II 

*cT 



c) b xy = -0,7 

II 

o 

VO 



d) m xy =-10 

II 

o 

bo 



e) V [x _ y] = - 14 

^ i 

II 

00 

v hi= 12 

II 

-0 


13. Determine si las siguientes relaciones son posibles o no y justifique su respuesta. 


a) 5^=19 R 2 =0,81 ^=10 

b) f = 4 + 7x 3c = 10 y = 64 

c) b yx - 0,3 b xy - -3 r 2 =- o,9 

d) m X} = 60 s 2 = S; = 50 b. x = 1,2 


r = 0,8 


14. De un analisis de regresion rectilinea, se tomaron los siguientes datos a partir de 20 elementos de 
una muestra: 
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M[x-y}> 0 M [ x+y \ = 7 

M W = 49 = ^r ^,=1-240 

Calcular el error de estimacion de Y con base en . 

15. Hallar la covarianza si: V[ x+ >]= 9 .2 y v b _ y] =m 

16. Para dos variables que tienen los siguientes datos: 

S y = 8 S x = 10 M[ y \ = 1 3 = y M[ v ] = 1 6 = v r- 0,6 
Calcular 5 2 y la ecuacion de 7 con base en . 

17. Conteste cierto o falso a los siguientes puntos: 

a) Un coeficiente de correlacion igual a -1 indica que la linea de regresion no es la que mejor refleja 
las relaciones entre las dos variables. 

b) La recta de regresion pasa por el punto donde se cortan las medias aritmeticas. 

c) El producto de las desviaciones tipicas es menor que la covarianza. 

d) Si r es mayor que uno, la recta ajustada explica mas que suficiente las relaciones entre las dos 
variables. 

e) El coeficiente de correlacion se da en valores menores de -1 y mayores de 1. 

18. En una tabla de frecuencias correspondiente a 20 parejas se obtuvo la siguiente informacion: 

Ex, =174 ly, 2 =5.904 Ej, =340 Ex, y, =3.062 Ex, 2 =1.626 

Se pide estimar el valor de Y cuando = 30; (promedio), con una confianza del 95%. 

19. Las variables X y Y estan correlacionadas. De las observaciones numericas correspondientes se ha 
obtenido: S x =3 S 2 = 25 m 2 xy = 400 

Hallar el coeficiente de correlacion lineal entre dichas variables y discutir el resultado. 

20. Siendo: b yx = 0,40 r = 0,94 s 2 x = 18 Se pide: 

a) Determinar el porcentaje de la varianza que queda sin explicar, en la regresion de Y en fimcion 
de . 

b) La varianza de la suma de las dos variables X y Y. 

21. Con los siguientes datos, correspondientes a 20 parejas de observaciones. 

Ex, = 174 Ej, =340 Ex, 2 =1.626 Zy; 1 =5.904 Ex, y, =3.062 k = 20 

a) Se pide estimar el valor de Y cuando =10, aplicando la regresion rectilinea. 

b) Calcular el coeficiente correlacion lineal. 

22. De un analisis de regresion se obtuvo que: b yx =0,2 r- 0,9 = 20 Hallar la V[ x+ ] 

23. Sila F w = 56,09 K u = 64,8 M [xy] = 11.223,5 = 4.567,21 = 27.812,25. 

Hallar el valor de X cuando toma el valor de 20. 


V V 2 

Mr 2 l = 81 = —— 
L J n 

m yA =50 
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Nota:F H = S ; F [v] = S’ 1 

24. De dos variables, X y Y, relacionadas entre si, se sabe que: 
x=8 y = 21 S x = 2 sl = 18 m xy = 3,6 

a) Hallar la ecuacion de la recta minima cuadratica de Y en funcion de . 

b) El coeficiente de correlacion. 

25. Durante varios anos se recopilaron datos sobre ventas (X) y gastos de publicidad ( Y ), expresados 
en millones de $. 

x = 28 y = 1,2 s 2 =8 S 2 y =l Cov = 4 

En los anos siguientes, los datos de publicidad se aumentaron en un 15%, lo que origino un 
incremento en las ventas. Calcular e interpretar: 

a) El coeficiente de correlacion de Pearson entre las dos variables, antes y despues del incremento 

b) /,Cual sera el valor esperado en las ventas, si gastan $3,000,000 en publicidad antes y despues 
del incremento? 

Nota: al incrementar cada valor de la variable Y en un 15%, se modifica la media, la varianza y la 
covarianza, aplicando las propiedades del producto asi: 

y = 1,1500 = 1,15(1,2) = 1,38 

S 2 y = 1,15 2 (S' 2 ) = 1,15 2 (2) = 2,645 

Cov = 1,15 (Coy) = 1,15(4) = 4,6 

26. En un curso de Estadistica para 20 alumnos se dieron los siguientes resultados, correspondientes a 
las notas de parciales ( ) y el examen final ( ) 

x =70 y = 15 X(Y,-y) 2 = 115,2 S', =4 S 2 =64 

a) lQvlq porcentaje de la varianza total de queda sin explicar por la recta de regresion? 

b) Un estudiante obtuvo una calificacion de 62 en el examen parcial. /,Cual es nuestra prediccion 
para la calificacion que obtendra en el examen final? 

c) Cual sera la varianza total de la suma de las variables (X + Y) 

27. Se conoce: 

a) X(£-j) 2 =810 

b) n = 30 

c) La suma de los cuadrados de las variaciones que no queda explicada por la recta de regresion de 
Y en funcion de es de 290. 

Se pide: 

a) Calcular el coeficiente de correlacion rectilinea 

b) Siendo Y = 120; fijar los limites de confianza del 90% para dicho estimativo. 

28. El 31 de julio de 2010 se tomaron los datos de los empleados de una empresa, siendo X = salarios en 
cientos de pesos; Y = tiempo de servicio en anos; x = 3.820 Y= 4 s y = S 2 X = 2.500 y Cov = 300. 


Mr 
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Si el 31 de diciembre de 2010, el numero de empleados en la empresa era el mismo y los salarios 
fueron aumentados en el 20% en agosto del mismo ano, i cual sera el coeficiente de correlacion de 
las dos variables a 31 de diciembre? 

29. A1 observar el numero de sucursales (X) y los costos mensuales (Y) en comunicacion telefonica con 
la casa central, en millones de $, para 10 empresas se encontro: 


x : 

i 

3 

5 

3 

2 

4 

1 

5 

2 

6 

3 

X : 

2 

3 

5 

4 

6 

2 

5 

1 

3 

5 


Apoyandose en la informacion anterior, ajuste la recta que muestre la relacion de los costos en 
funcion del numero de sucursales y estime los costos de una empresa con 10 sucursales. 


30. Diga si los siguientes puntos son ciertos o falsos y por que. 

a) En una serie bidimensional de datos es posible que; S 2 y =28,6 S 2 y = 28,2 

b) A1 estudiar las relaciones entre Xy Fes posible que: Y= 5 + 4,8 - = 5 _ = 20 

C) Cov = 80 S 2 x =S 2 y =50 b yx = 1,2 

d) S 2 iy = 19 R 2 =0,81 S y = it) 

e) b xy = 0,3 b, x = -30 R 2 =-0,9 

31. Se desea buscar la relacion existente entre las ventas (Y) (en millones de $) y las utilidades (X) de 
una compania con 50 sucursales. Se dispone de la siguiente informacion. 

Zx, =100 Zx,y, _ 3Q Z^ 2 = 5.390,5 Xy, =500 r = 0,8 

n 

Halle e interprete: 

a) x = b xy y + c xy b) s] y y S 2 X 

c) Las utilidades de una compania con 20 millones pesos en ventas. 

32. Considere dos variables, una continua (X) y otra discreta (Y). Se pide ordenar los datos en una tabla 
de frecuencia bidimensional. Considere n = 30 para obtener el valor de la amplitud del intervalo ( ) 
en la variable X. 


x i : 

2 

9 

7 6 

5 

8 7 9 

3 

9 

6 

5 

6 

6 

8 

9 

7 

8 

6 

7 

8 

3 

8 

7 

9 

5 

7 

6 

4 

8 

y, : 

2 

3 

1 3 

2 

1 1 3 

2 

3 

4 

2 

3 

2 

3 

4 

3 

3 

1 

3 

4 

3 

4 

3 

4 

3 

4 

2 

3 

3 


Se pide: 

a) Estimar el valor de Y cuando = 6. 

b) Fijar limites de confianza de Y, con una P = 95%. 

c) Determinar el coeficiente de correlacion. 

33. De un analisis de regresion se obtuvo que: b = 0,2 r = 0,9 y S 2 = 20 hallar la varianza de la 

suma de las dos variables ( + ) . 

34. Con los siguientes datos: Y . =45 E .= 15 E 2 = 495 E 2 = 55 E . .= 165 n = 5 
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Se pide 

a) Calcular el coeficiente de correlacion 

b) Estimar el valor de Y cuando = 6, y establecer los limites de confianza del 95% 

c) Determinar el porcentaje de la varianza que quedo sin explicar por la recta de regresion. 

35. Con los ingresos y gastos mensuales de 10 familias (en cientos de $) 


INGRESO x : 

i 

6.500 

7.000 

8.000 

10.000 

11.000 

7.500 

8.000 

9.000 

10.800 

8.300 

GASTOS y. : 

6.300 

6.700 

7.000 

8.200 

9.000 

7.300 

7.900 

8.500 

8.600 

7.700 


a) Dibujar el diagrama de dispersion o nube de puntos. 

b) Encontrar la linea de regresion deX (ingresos) en funcion de (gastos), dibujarla en el diagrama. 

c) Calcular los ingresos de una familia que tiene un gasto mensual de 12.400 (cientos de pesos). 


36. Siendo x = 30 S 2 = 25 r = 0,80 y = 45 S 2 =S 

a) Estimar el valor de X cuando = 28 

b) Determinar la varianza residual. 

37. Diga si las siguientes relaciones son verdaderas o falsas. ^Por que? 


a) Y = 0,932x + 6,84 

x = 104 

y -105 


b) Z(y,-Y i ) 2 = 24 

II 

<N 

1 

n = 5 

si =18 

> 

c) m xy = 4 

Y = y + 4(x-x) 

s l ~9 


d) Y = 0,2jc-4 

S 2 X = 50 

x = 30 

Ik,y, = 50« 

e) s]= 16 

II 

O 

U> 

II 

X 

Co 

Y = 2x +5 


38. Una compania de transporte analiza una muestra de 10 embarques por camion y registra la distancia 
en kilometros, ademas el tiempo de entrega de la mercancia medido por dias, obteniendose la 
siguiente informacion: 

Ik, =7.620 ly, =28,5 Ik, y, = 26.370 Ik, 2 =7.104.300 Yy) = 99,75 

a) La compania informa que si el kilometraje es de 1.500, el tiempo necesario para la entrega es 
mayor de tres dias. ^Esta usted de acuerdo? 

b) ^Que porcentaje de informacion es explicada por la recta de regresion? 

39. De un grupo de 50 individuos, del cual se examinan dos variables, se tiene la siguiente 
informacion: 

Z(x, - x)(y r -y)= 241 Y,(Y,-y) 2 =196,34 l(x f - xf = 310 

X(y,-yf = 218,15 3c = 20 y = 30 

Se pide: 

a) Estimar el valor de Y, cuando = 30, fijando limites del 92,8% 

b) lQuq porcentaje de la varianza total queda sin explicar por la recta de regresion de en ? 
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40. Suponga que se esta estudiando el efecto de cierta friction constante y uniforme sobre laminas 
metalicas del mismo grosor y de la misma aleacion. Se han efectuado 8 observaciones cuyos 
resultados son: 

X = Tiempo de friction Y = Grosor de la lamina en mm. 



3 

5 

6 

8 

9 

10 

12 

15 


9,5 

9,0 

8,8 

8,5 

8,2 

8,0 

7,6 

7,0 


Se pide mediante el calculo de la ecuacion de regresion: 

a) ^Cual fue el grosor original de las laminas? 

b) ^Cuantas horas tardara la friccion en destruir una lamina? 

c) ^Tiene algun sentido pronosticar el grosor de una lamina despues de 70 horas de friccion? 

41. La solubilidad en el agua de cierto producto organico se hace mas rapida con el auxilio de un agente 
quimico. Segun presumimos de las siguientes observaciones efectuadas en 6 muestras de 20 gramos 
de producto y diversas dosis del agente quimico: 


AGENTE (gramos): 

3 

2 

1 

3 

5 

4 

SOLUBILIDAD (segundos): 

7 

9 

10 

8 

5 

6 


a) Calcule el coeficiente de correlation. 

b) ^Cual es la rapidez de solucion de 10 gramos del producto en ausencia del agente quimico? 

c) /,Que proportion del agente debera contener el producto para que la solucion sea instantanea? 


42. Se ha observado, que para predecir la demanda (consumo) de combustible para calefaccion, 
resulta ser mas preciso el pronostico a largo plazo de las temperaturas y el uso, de la relation 
temperatura - consumo, que el tratar de pronosticar directamente la demanda analizando las ventas 
de combustibles. Un distribuidor mantiene un registro de ventas mensuales de combustibles y 
de temperaturas maximas en esos meses. A continuation aparecen los datos de 8 de estos meses 
seleccionados al azar. 


VOLUMEN VENTAS: 

16,2 

17,4 

12,3 

35,9 

42,1 

26,4 

19,0 

10,1 

PROMEDIO DETEMPERATURAS 
MAXIMAS (grados centigrados): 

18,3 

21,2 

17,6 

23,4 

25,2 

20,4 

21,6 

18,6 


Se pide: 

a) Grafique los puntos (observaciones reales) y las rectas de Y y X 

b) ^Que porcentaje de la variacion en las ventas mensuales se explica por la temperatura maxima 
promedio? 

c) Encuentre el intervalo de confianza del 95% para las ventas mensuales esperadas (medias) en 
aquellos meses en que el promedio de la temperatura maxima sea de 25 grados centigrados. 

43. El dueno de una taberna encontro una correlacion de 0,80 entre el tiempo de permanencia de los 
compradores en el establecimiento (X) y el valor de la cuenta cancelada (Y). 


PERMANENCIA (minutos): 

- =25 

j = 7,5 

VALOR DE LA CUENTA (miles de $): 

- =60 

j = 14,4 


a) Para un tiempo de permanencia de 40 minutos, estimar el valor de la cuenta (en miles de $) 

b) ^Cual es el porcentaje de la varianza total que queda sin explicar por la recta de regresion? 
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44. Cuando el coeficiente de correlacion es 0,90, dibujar la grafica de las lineas de regresion (Y y X ); 
sabiendo que: 

- =30 j =5 “= 45 s 2 = 6 4 

45. Un gerente de produccion, en asocio con el jefe de personal, hizo un estudio al personal empleado 

en el proceso de manufactura. Encontro que despues de que estos empleados habian permanecido 
en el trabajo por un ano, eran capaces de obtener una medida de actuacion de dichas personas, que 
reflejase adecuadamente su eficiencia. De modo que diseno una prueba de seleccion para predecir 
su eficiencia eventual y obtuvo una correlacion de 0,65 en la medida de eficiencia (Y). La media de 
la prueba es 50; s = 6 “=100 s = 10. Contestar las siguientes preguntas basadas en esos hechos: 

Si un empleado obtiene una calificacion de 40 en la prueba de seleccion. 

a) ^Cual es su calificacion predicha de eficiencia? 

b) i Que porcentaje de la varianza total queda sin explicar por la recta de regresion? 

46. Responda VERDADERO cuando el enunciado sea valido. En caso contrario, la palabra en negrilla 
debera sustituirse por otra que sea valida. 

a) Un diagrama de frecuencias consiste en la representacion de todos los pares ordenados de 
datos observados en un sistema de ejes coordenados. 

b) El coeficiente de variacion, es la medida que nos determina el grado de correlacion entre dos 
variables. 

c) Un coeficiente de correlacion cero significa que las dos variables se encuentran perfectamente 
correlacionadas. 

d) Una varian a no explicada igual a cero significa que la varianza total es igual a la varianza 
explicada. 

e) El coeficiente de correlacion lineal varia entre cero y + 1. 

f) El valor que se predice corresponde a la variable dependiente. 

47. En una regresion lineal simple para la cual se tienen 30 observaciones, se halla que R 2 =0,70 y 
S 2 . = 1,2. Halle S 2 y S 2 

a 5 J 

48. En un analisis de regresion simple y de correlacion basado en 150 observaciones, se halla que 
r = 0,85 y S 2 = 16 . 

a) Determinar la varianza explicada de Y. 

b) Ademas, la proporcion de la variacion no explicada respecto a la variacion total. 

49. En un analisis de regresion con 20 observaciones, la variacion explicada es de 56,2 y la total 66,3. 
Calcular la desviacion residual para la ecuacion de regresion Y = b + c. 

50. En una regresion lineal simple, el valor estimado del coeficiente de regresion b = 2,5, con S = 0,8 

a) Establecer un intervalo de confianza del 95% para el verdadero parametro de /? , si n = 25 

b) Probar al nivel del 5% el coeficiente de regresion. 
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51. Supongase que al analizar la relacion entre 30 pares de observaciones, se encuentra que la suma 
del cuadrado de las diferencias entre los valores de la variable y su media aritmetica es de 220, 
(Z( ~) 2 = 220); y que el cuadrado de las diferencias entre los valores estimados y su media es de 

38,4; (7— ~) 2 = 38,4). La pendiente de la recta es positiva. 

a) Calcule el coeficiente de determinacion. 

b) ^Que porcentaje de la varianza ha sido explicada por la recta de regresion? 

c) ^Puede rechazarse la hipotesis de que no existe correlacion lineal a un nivel de significacion del 
5%? 


52. El departamento de pinturas en una cadena de almacenes tiene 2 promociones en el ano, una en 
enero y la otra en octubre. El precio de la pintura se reduce del 10 al 30% durante estas realizaciones. 
La administracion desea aumentar ese porcentaje en Enero. Aunque no va a tener utilidades si 
aumenta el porcentaje, el gerente de mercados espera generar ventas de articulos auxiliares, tales 
como: brochas, rodillos, cintas protectoras y diluyentes de pinturas que le ayudaria a aumentar 
las utilidades. Un nuevo empleado del departamento de asesoria en mercados esta deseoso de 
impresionar al Comite de fijacion de politica de precios. Uno de ellos dice “nada molesta mas a un 
cliente que asistir a una realizacion y encontrar que el articulo anunciado se agoto”. Ademas se debe 
tener una provision de tal manera que los costos de inventario puedan contrarrestar las utilidades de 
la realizacion. 


PORCIENTO 

DE DESCUENTO: 

10 

12 

14 

16 

18 

20 

22 

24 

26 

28 

30 

PORCIENTO 

DE LA VARIACION 

3,43 

3,75 

4,52 

5,13 

5,94 

6,35 

7,99 

8,23 

9,46 

10,35 

12,00 

DE LAS VENTAS: 













a) Si la empresa considera que tiene unos inventarios que permiten el aumento de las ventas en un 
18%, ^que porcentaje de descuento podra dar? 

b) iQue porcentaje de la varianza total no queda explicada por la recta de regresion? 

c) lQuq grado de correlacion hay entre estas variables, la aceptaria usted? 

d) Fije un intervalo de confianza al 95% para el valor estimado del punto (a). 

53. Supongamos que una cadena de supermercados financia un estudio sobre gastos mensuales en 
alimentos, de familias de 4 miembros. La investigacion se limito a familias con ingresos netos entre 
$688,000 y $820,000, con lo cual se obtuvo la siguiente ecuacion: 7= -18.000 + 0,85 . 

= gastos mensuales estimados en alimentos; = ingresos. 

Ademas suponga que la ecuacion proporciona un buen ajuste 

a) Estime los gastos en alimentos en un mes, para una familia de 4 miembros, con un ingreso de 
$700,000 

b) Uno de los directivos de la compania se preocupa por el hecho de que la ecuacion aparentemente 
indica que para una familia que tiene un ingreso de $ 12.000 no gastaria nada en alimentos. ^Cual 
seria su respuesta? 

Explique brevemente que sucederia si la ecuacion anterior se utiliza para cada uno de los 
siguientes casos: 

c) Estimacion de los gastos en alimentos de familias de cinco miembros, que tienen un ingreso de 
$598,000 
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d) Estimacion de los gastos en alimentos de familias de cuatro miembros, con ingresos de 
$450,000 

54. Suponga que Y = nota promedio en el examen de ingreso (escala de 0 - 100) y X = miles de pesos 
en gastos semanales, que incurre en el primer ano de estudio en esa universidad, sabiendo que la 
recta de regresion Y sobre X esta expresada por la ecuacion Y = 50 4- 0,3 . 

a) iC ual es la interpretacion del coeficiente de regresion igual a 0,3. 

b) ^Que valor de Y se podria estimar si = 40.000? 

55. En una regresion lineal de Y sobre X, basada en 20 observaciones, el valor del coeficiente de 
determinacion es de 0,64. 

a) ^Indica este resultado que existe una correlacion significativa entre X y Y a un nivel del 5%, para 
una prueba bilateral? 

b) /,Cual es la proporcion de la variacion que queda sin explicar por esta recta de regresion? 

56. El analista de una fabrica de automoviles quiere desarrollar un modelo estadistico para predecir 
el tiempo de entrega (los dias entre la compra del automovil y la entrega real del mismo) de 
automoviles nuevos de fabricacion especial. El cree que hay relacion lineal entre las opciones del 
automovil ordenado y su tiempo de entrega. Se selecciona una muestra aleatoria de 16 automoviles 
comprados, con los resultados que se presentan a continuacion: 


No. DE OPCIONES ORDENADAS: 

3 

4 

4 

7 

7 

8 

9 

11 

TIEMPO DE ENTREGA (EN DIAS): 

25 

32 

26 

38 

34 

41 

39 

46 


No. DE OPCIONES ORDENADAS: 

12 

12 

14 

16 

17 

20 

23 

25 

TIEMPO DE ENTREGA (EN DIAS): 

44 

51 

53 

58 

61 

64 

66 

70 


a) ^Se puede predecir cuantos dias se necesitarian para la entrega de un automovil, si el analista 
considera que se puede presentar el caso de un automovil con 24 opciones? 


b) Estime un intervalo de confianza del 95% del tiempo promedio de entrega para todos los 
automoviles comprados con 15 opciones. 

c) Pruebe al nivel del 5%, la existencia de una asociacion real entre el numero de opciones y el 
tiempo de entrega. (Probar si hay correlacion). 

d) Pruebe al nivel del 5% que hay una relacion significativa entre las variables X y Y. (Relacion 
lineal significativa). 

57. Cinco empresas arrojan las siguientes cifras: X = utilidad bruta; Y = costo mano de obra (millones 
de pesos semanales). 


i 

4 

9 

8 

10 

12 

i 

3 

8 

8 

6 

4 


Calcule por el metodo de los minimos cuadrados, la utilidad bruta esperada si el costo de la mano 
de obra es de $10 millones semanales. 


58. Con los siguientes datos: Z . = 15 Z 2 = 55 Z . = 45 Z 2 = 495 Z . =165 n = 5 

° ii ii ii 

a) Establecer la ecuacion de en funcion de . 















612 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


b) Calcular el coeficiente de correlacion de Pearson 

c ) Calcular el % de la varianza que queda explicada por la recta de regresion. 

59. La decima estacion de policla de la ciudad desea determinar el tiempo de respuesta para llegar al 
sitio solicitado. La presencia depende linealmente de la distancia que hay del sitio a la estacion. 
Para 35 llamadas, los datos son: 

I =234 Z 2 = 1.796 Z =831 Z 2 = 21.037 Z . =5.890 

i i i i ii 

a) Estimar Y en funcion de X. 

b) Calcular el coeficiente de correlacion. 

60. Con los siguientes datos de 10 pares de observaciones: 


i : 

12 

22 

36 

20 

26 

34 

18 

20 

25 

30 

i 

5 

8 

12 

10 

14 

16 

10 

13 

18 

19 


a) Se puede estimar el valor de X cuando =15. 

b) Calcular el coeficiente de determinacion. 


Regresion lineal ponderada 

Cuando se tiene un numero grande de pares de observaciones, digamos 50, 100 o mas, no hay problema 
si aplicamos EXCEL, pero si no contamos con esa facilidad o la informacion se da en cuadro de doble 
entrada, no tenemos mas remedio que hacerlo manualmente en forma simplificada. Veamos un ejemplo de 
production y costo, pero no de 10 pares de observaciones, sino de 80 establecimientos, cuya informacion 
se presenta a continuation. 

Ejemplo 1. 


Tabla 12.2 Tabla de calculo 
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= 70,4943 


si _ 5.961-80 (7,7125) =15 0298 



Cov , 80(15-476) - (1.686)(617) = 3Q ^ 
80 


Cov = 15 - 476 -21,075(7,7125) = 30,9091 
80 


Cov 


30 9091 

b = = 0,4384 => Con calculadora da el mismo valor 


70,4943 


b = nY L x J _y i n L - (Sx,^) (S^w,) 

«£x 2 -(LXjfii ) 2 


b _ 80(15.476) -q.686)(617) _ 013g1 
80(41.172) - (1.686) 2 


Xv, y, n { - nx y 


y 2 —2 

Zv, n f - nx 


b _ 15.476 - 80 (7,7125) (21,075) = Q 13g/| 
41.172 -80 (21,075) 2 


Mediante un sistema de ecuaciones nor males: 


(1) 617 = 1.6866 + 80c 

(2) 15.476 =41.1726+1.686c 

El calculo de b = y c = fi Q lo podemos calcular de varias maneras. 
donde b = 0,4384 y c — —1,52807 ( resultados con la calculadora) 

En forma directa el valor de c se obtendra asi: 


(1) 'Ly t n l =b'Lx t n l +nc 

(2) Xy ; x t n t — bUxf n t + cZx, n t 


Zy t n t - b'Lx t n t c _ 617 - 0,4384 (1.686) _ _ ^ 52 806 
n 80 


c — y— bx cm 7,7125 - 0,4384 (21,075) = -1,52806 

En la regresion lineal simple si queremos estimar los costos de una empresa, presuntamente su pro- 
duccion es de 24 miles de millones de pesos, lo hacemos con los datos de las 80 empresas. 


7 = 6 + c => Y= 0,4384 (24) — 1,52806 = 8,99 miles de millones de $, seria el costo estima- 


tivo para esa empresa. 


Ahora fijamos los limites de confianza para ese estimativo; en primer lugar hay necesidad de calcu¬ 
lar la varianza residual, por alguno de los siguientes metodos: 
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„2 _Y(y-y t ) 2 n, 


No lo realizamos por el espacio y tiempo que exige la aplicacion 
de esta formula, pero el lector podra hacerlo. 



Zy?n,-cl,y t n l -bl,y l x, n, 
n 


2 _ 5.961 + l,52806(617)-0,4384(15.476) _ t yin 
- go = 1,49 


2 2 COV* 

s y< ~ s y 2 


i_ teMn 30,91 


5 -=15,030 
>x 70,49 


1,48 s yx = V 1,48 = 1,22 


2 2/i 2 \ 

^ yx ~ ^ ) 


7 ± 

y/n 


s 2 yx = 15,030 (1 - 0,90) = 1,50 (Mediante la calculadora es 1,48) 

1,22 [9,26 

8,99 ± 1,96 -4= = 8,99 ±0,27 = \ Miles mill $ 

V80 [8,72 


Algunos aplican las siguientes formulas para la estimacion del valor del promedio respectivamente: 




Y ± z jr„ 

+ 

'5' 

1 

Hi 

6 

.>3 

I 



1 

1 n 


Recuerde que = 24 en el ejercicio que se acaba de desarrollar. Nos falta calcular el coeficiente de 
correlacion de Pearson siendo: 


n'Lx i y i n i - (Ex, n ,) (Ly- n,) 

tJ [n I x; «, - (E X, n,) 2 ] [n I >>; n, - 

-Vy,",) 2 ] 

'Lx i y i n-my 


yj [ex 2 /?, - nx 2 ] [e y 2 n, -nf ] 



Tambien se puede obtener mediante 


r 15.476-80 (21,075) (7,7125) ^ Q95 y ^2 ^ Q?9 

7[41.172-80(21,075) 2 ][5.961 - 80(7,7125) 2 ] 

Ejemplo 2. Cuando el numero par de observaciones es grande, parece aconsejable su agrupacion 
mediante tablas de frecuencias o cuadros de doble entrada. Esta ultima forma de presentacion, permite 
observar que el uso de momentos bidimensionales, por la simbologia empleada, antes de simplificar la 
tarea del alumno, dificulta el calculo de los estimativos de X y de Y. 

Hagamos un ejercicio con 50 pares de observaciones: 


i’ 

8 

2 

4 

6 

8 

6 

6 

6 

8 

6 

4 

2 

6 

6 

8 

6 

2 

V 

2 

0 

1 

1 

3 

2 

3 

1 

0 

3 

1 

2 

2 

1 

3 

3 

0 




























































En la determinacion de los valores que toma la variable, discreta o continua, se sigue el mismo 
procedimiento que en la unidimensional. En este ejercicio toma valores de: 2, 4, 6 y 8; la variable 
de: 0, 1, 2 y 3, que pueden ser colocados, indistintamente, en las casillas de la parte inferior de la tabla o 
en las casillas del vertical. 


Tabla 12. 3 Cuadro en doble entrada 


3 

- 

- 

6 

3 

2 

5 

3 

8 

3 

1 

- 

6 

4 

2 

0 

3 

4 

2 

1 

i 

z 

2 

4 

6 

8 


Tabla 12. 4 Datos y calculo con frecuencia 


i 

i 

n . 

i 

. n. 

i i 

. n. 

i i 

2 n. 

i i 

2 n. 

i i 

. . n. 

i i i 

2 

0 

3 

6 

0 

12 

0 

0 

2 

2 

5 

10 

10 

20 

20 

20 

4 

0 

4 

16 

0 

64 

0 

0 

4 

1 

6 

24 

6 

96 

6 

24 

4 

2 

3 

12 

6 

48 

12 

24 

6 

0 

2 

12 

0 

72 

0 

0 

6 

1 

4 

24 

4 

144 

4 

24 

6 

2 

8 

48 

16 

288 

32 

96 

6 

3 

6 

36 

18 

216 

54 

108 

8 

0 

1 

8 

0 

64 

0 

0 

8 

1 

2 

16 

2 

128 

2 

16 

8 

2 

3 

24 

6 

192 

12 

48 

8 

3 

3 

24 

9 

192 

27 

72 

2 

50 

260 

77 

1.536 

169 

432 

i 

i 

n 


. n. 

i i 

2 f 

i j i 

}f 

i j i 

f 

i i J i 
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_ 260 
n 50 

n 50 


s 2 _ n t _ -2 _ 1.536 


22 

2 


50 


*Se puede estimar Y X como en a recta uti i ando a simbo ogia 
que aparece a continuacion. Si queremos simplificar las operaciones 
podemos cambiar de posicion por para ue siempre estimemos 
a Y. 


-5,2 =30,72-27,04 = 3,68 


5 2 = Zy t n, _ 2 = M _ i ; 54 2 = 3,38 - 2,37 = 1,01 (1,0084)1 

y n 50 


m. 


= n > - 3c y = 4 ^ - 5,2(1,54) = 8,64 - 8,01 = 0,63 (0,632) * 

n 50 


* Son valores que arroja la calculadora. 

Para el calculo de los parametros de las rectas de regresion se procede como en la regresion 
simple: 


m 0,63 

= —r =-=0,17 

>A s] 3,68 


m„ 0 63 


62 


(0,171739)* 

(0,626735)* 


c >A . = y- b, x x = 1,54 - (0,17) (5,2) = 1,54 - 0,88 = 0,66 (0,6469565)* 

c xy = x- b xy y = 5,2 - (0,62) (1,54) = 5,2 - 0,95 = 4,25 

* la cifra aparece con mas decimales cuando usamos la calculadora. 

Las ecuaciones seran: Y— 0,17 4- 0,66 y X = 0,62 4- 4,25 

Para el calculo de la varianza residual se pueden aplicar las formulas siguientes: 


1) 

<N 

<£r 

i 

w 

ii 


.2 _Z(x,-Xfn, 


n 


** n 


2 ) 


n2 2 y) n , ~ c yx 'Ly l n-b yt Lx , y, n, 


n 2 Zx?n l -c xy 'Lx t n t -b xy ’Lx l y t n l 

> x n 


% n 


2 


2 

o2 _ „2 m xy 

*y 2 

^X 


„2 _ r.2 _ m xy 

‘Ly 1 ’ x 2 

5 > 


3 ) 
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Aplicaremos las formulas (2) y (3) para el calculo de la varianza residual de la recta de regresion 
de X en funcion de Y. 


™ 0 2 1.536 - 4,25 (260) - 0,62 (432) Q 

(2) S xv =- — -= 3,26 


50 


(3) S ? y = 3,68 - = 3,68 - 0,40 = 3,28 

En la aplicacion de las anteriores formulas se presentan pequenas diferencias, debido a las aproxi- 
maciones. Con la varianza residual, se puede calcular la desviacion residual, los limites de confianza y 
el coeficiente de correlacion. 


S xy = yf3 ,26 =1,81 



Los limites de confianza con una P = 95,5% para X cuando toma el valor de 4. 


x = b xy (y-y) + x 


X = 0,62 (4 -1,54) + 5,2 = 0,62 (2,46) + 5,2 = 1.53 + 5,2= 6,73 

7,56 


X = 6,73 ± 2(1,81) 


1 + _(4— 1,54) = 6 73 + o 83 _ 

(260) 2 L 5,90 


50 


1.536 


50 


El coeficiente de correlacion lineal se podra calcular por diferentes formulas. 



Aplicaremos la formula (3). 


I 3 28 i - 

Con la formula (2) dara aproximadamente: r = Jl —-— = y l - 0,89 = 0,33 

\ 3,68 

Otra forma de obtener los parametros bye, trabajando con un sistema de ecuaciones, es como sigue: 


Para Y = b + c las ecuaciones son: 


Para X = b + c las ecuaciones son: 


(1) Xy,n, =b yx 1.x, n, + c^n, 

(2) lx, y, n, = b yx lx? n, + c yx lx, n, 


(1) lx,n, =b xy ly,n, + c xy ln, 

(2) Ex, y, n, = b ly? «, + c^ly, n, 


Obtengamos los valores de b y c 

(1) 260 = 11b + 50 c Anulamos a c para ello multiplicamos la primera ecuacion por - 1,54 

(2) 432 = 169 b +llc 
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432,0 = 169,006„ + 77c n 

xy 

-400,4 = 118,586 -77 c A _ v 

_I_ _+_ 216 

31,6 = 50,42 b xy 0 6^ = ^ ^ = 0,63 Reemplazamos en le primera ecuacion 

(1) 260 = 77 (0,63) + 50c A> => c xy = = 4,23 aproximadamente 

r \ 

USO DE LA CALCULADORA 

Todos estos calculos pueden ser agilizados mediante el uso de calculadoras que muestren en pantalla los 
siguientes comandos, oprimiendo MODE, y luego la sigla R , o RE , slmbolos equivalentes a regresion 
inea . 


El proceso de entrada de los datos se hace de la siguiente 

manera |TJ [T] |jT] [T] 3 

DT 

en la pantalla debe aparecer asi: 

2 , 0 ; 3 

2 , 2 ; 5 

4 ? 0 ; 4 y asi sucesivamente, la 


salida de los datos es exactamente igual como se hizo en el ejercicio anterior, salvo que £ . corresponde 
a Yj 72., lo mismo en las demas operaciones, todas ellas multiplicadas por n. o f. 

V _i_ i ___ J 

Ejemplo 3. De una poblacion de 1.200 parejas que han contraido matrimonio se extraen, al azar, 50 
parejas de edades, simboliza las edades de los hombres y las mujeres. Los datos son: 


Tabla 12. 5 Calculo para aparejas de observaciones moderadas 


i 

i 

n . 

i 

. n. 

i i 

. n. 

i i 

2 n. 

i i 

2 n. 

i i 

. n. 

i i i 

Y. 

i 

29 

23 

6 

174 

138 

5.046 

3.174 

4.002 

25,86 

35 

34 

14 

490 

476 

17.150 

16.184 

16.660 

30,95 

29 

26 

20 

580 

520 

16.820 

13.520 

15.080 

25,86 

38 

30 

8 

304 

240 

11.552 

7.200 

9.120 

33,50 

40 

35 

2 

80 

70 

3.200 

2.450 

2.800 

35,20 

£ 

50 

1.628 

1.444 

53.768 

42.528 

47.662 

- 

i 

i 

/, 

J, 

ifi 

2 f 

i j i 

2 f 

i j i 

• f 

i i j i 

- 


Calculemos los coeficientes angulares ( b ) y de posicion (c) cuando se va a estimar Y. 


(i) 

Yy i x- = 6 Yx-n j + nc 





(2) 

Yx t y f n t =6Xxf n t + cYx t n t 


(1) 1.444 = 1.628 b + 50c 

(2) 47.662 = 53.7686 +1.628c 


Multiplicamos a la ecuacion (1) por 32,56 y se lo restamos a la ecuacion (2) 


(1) 47.662 = 53.7686 + 1.628c 

(2) -47.016,64 = -53.007,686 - 1.628c 

645,36 = 760,326 

Reemplazamos a b en la ecuacion (1) 


6 = 


645,36 

760,32 


= 0,8488 = 0,85 


(1) 1,444 = 1.628 (0,8488) + 50c 


c = 


1.444-1.628(0,8488) 


1,243 


50 





















































CAPfTULO DOCE 

REGRESION Y CORRELACION 


Tambien se hubiesen podido obtener estos coeficientes (b y c) mediante la aplicacion de otras for¬ 
mulas. Veamoslas 


- Zy t n t 1.444 OQ QQ - Zx t n t _ 1.628 ^ 

y =- y - = 28,88 x = —x = ^ =32,56 


50 


50 


r.2 _ 


x" 1 2 —2 

2 Zx n-nx 

si - —' '- 


__ 

—- X y 


b = nLx, y, n t - (Lx, n f ) (Ly ,«,) 
n Lx 2 n t - (EXjiii) 2 

b= ’Lx 1 y 1 n 1 -nxy_ 

'Lx 2 Hi —rix 2 


2 42.528 - 50(28,88) 

Sf =-- L = 16.51 


(Corregida s 2 = 16,84 ) 
53.768 - 50(32,56) 2 


st = 


50 


= 15,21 


(Corregida s 2 =15,52) 
47.662 


m » = - 50 


-28,88(32,56)= 12,91 


_ 50(47.662)-1.628(1.444) _ g5 
50(53.768) — (1.628) 2 


b _ 47.662 - 50(32,56) (28,88) _ Q gg 


53.768 - 50(32,56) 


b=—2L 

si 


12 91 

6 =75fr= 0 - 85 


c = 28,88 -0,85(32,56) = 1,21 
_ 1.444 -0,85(1.628) 


c = y-bx 

Hy f n t - bYx f n t 

C — - u —- 

n 50 

Si le damos a el valor de 25 se tendra que Y sera igual a: 

Y = 0,85 +1,21 Y = 0,85 ( - 32,56) + 28,88 

Y= 0,85 (25) + 1,21 = 22,46 6 Y= 0,85 (25 - 32,56) + 28,88 = 22,46 

La diferencia que se puede presentar en estos resultados, se debe a las aproximaciones que se han 
hecho al trabajar con dos decimales. 


En cuanto a la arian a residua , se obtendra aplicando las siguientes formulas: 


619 




















620 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


52 _ h(y t — Y) n t 

.K yi 


2 = 277 z 50 = 

> A 50 ’ 


s l, = s l (1 - r1 ) 

S 2 yx = 16,51(1-0,66) = 5,61 

ci 2 _ ^ y) n , ~ cZy, n, ~b'Ly l x, n, 

o2 42.528 - 1,21(1.444) - 0,85(47.662) 

> x 

n 

‘ S > J- 50 


=5,36 


„ 2 _ „ 2 _ > 
‘V *> s 2 


„2 -i»i 12,91 _ g cg 
S >* 16,51 15,21 5,55 


s 2 = s 2 - 2b m„ + b 2 Si 


sl = 16,51 - 2(0,85)(12,91) + 0,85 2 (15,21) = 5,55 


El error estandar de estimation sera igual: 



S yx =fi, 55 =236 


En cuanto al coeficiente de correlation , al igual que en la regresion lineal se tendra que: 


9 m XA 

tf 2 = A> 


S 1 S 1 

LJ x LJ y 


R 2 =1—f- 


R 2 = 


12,91 2 


(15,21) (16,51) 


= 0,66 


9 5 55 

r 2 =i-2£2 7 = Qfi6 


16,51 



_ [50(47.662) -1.628(1.444)] 2 _ 

[50(53.768) - (1.628) 2 ][50(42.528) - (1.444) 2 ] 


R = ^066 =0,81 


Los limites del 95% de confianza para 7, cuando = 25 como promedio. 


Y = y±Z S 


yx 


1 ( 


n 


7=22,46 ± 1,96(2,12) 


1 (25-32,56f 


50 + 


53.768 ■ 


(1.628) 

50 


= 22,46 ± 1,28 


[23,74 

[21,18 


Se observa, tal y como lo mencionamos en la regresion lineal simple, que si el tamano de la muestra 
se hace grande, el error sera menor. 


























































CAPfTULO DOCE 

REGRESION Y CORRELACION 


621 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

61. Con los siguientes datos: 




Se pide: 

a) Estimar el valor de X cuando =14. 

b) Determinar el coeficiente de correlacion. 

c) Calcular las respectivas varianzas residual y explicada. 

d) Fijar limites de confianza del 95% para la estimacion obtenida en el punto (a). 

62. Utilizar los siguientes datos sobre salarios semanales ( ) y gastos semanales ( ) (ambos en miles 
de $) de 30 familias. 


SALARIO 

SEMANAL 

GASTO SEMANAL 

35 

40 

60 

70 

120 


1 

4 

5 

100 


6 

2 

3 

80 

2 

2 

1 

- 

60 

4 

- 

- 

- 


Se pide: 

a) Determinar el coeficiente de correlacion. 

b) Estimar el salario semanal de una familia que tiene gastos de $50,000 semanales. 

c) Fijar limites de confianza del 95% para la estimacion del ingreso. 

d) Calcular la varianza explicada y el porcentaje de la varianza total que queda sin explicar por la 
recta de regresion. 

63. Una fabrica clasifica a sus empleados, 30 en total, de acuerdo con los anos de antigiiedad y edad, asi: 


ANOS 

ANTIG EDAD 

EDAD 

20 1-28 

28 1-36 

36 1-44 

2 

3 

2 

1 

4 

4 

5 

3 

6 

1 

3 

5 

8 

- 

1 

2 


a) Determinar cual debe ser la edad del empleado con 5 anos de antigiiedad en la fabrica. 

b) Determine el coeficiente de correlacion al cuadrado. 

64. Los siguientes datos del semestre pasado, representan el numero de dias de incapacidad por 
enfermedad o accidente de trabajo (1") y los anos de antigiiedad en la compania (X). Se tomo una 
muestra de 30 empleados que fueron incapacitados. 
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V 

1 

00 

2 

3 

5 

3 

7 

r 

2 

1 

5 

6 

4 

9 

2 

n.\ 

2 

3 

6 

5 

4 

7 

3 


a) De acuerdo a la informacion dada, se desea estimar el numero de dias de incapacidad para un 
trabajador con una antiguedad de 6 anos. 

b) Ademas determine el coeficiente de correlacion. 


Con los siguientes datos 

n = 50 

E ,?z. = 374 E 

i i 

?«. = 4.410 

i i 


£ 2 n = 19.736 

l i 

E . n. = 9.282 E 

i i i 

. n. = 800 

Con esta informacion se pide estimar Y , cuando 

= 30, fijando limites de confianza 

del 95%. 


66. Con el punto anterior calcular el coeficiente de correlacion de Pearson 

67. Con los siguientes datos: 


l 

3 

5 

10 

16 

26 


i 

1 

2 

4 

8 

12 


n\ 

3 

7 

10 

8 

2 

= 30 


Se pide calcular: 

a) Y cuando =14; b) El coeficiente de determinacion 


REGRESION PARABOLICA SIMPLE 


Anteriormente se explico el concepto y la aplicacion que tiene la regresion inea (simple y ponderada), 
ademas de anotar la importancia al ser usada para senalar la tendencia en las series de tiempo, que sera 
desarrollada en el capitulo siguiente; la regresion parabo ica tambien es considerada de gran utilidad en 
el estudio de muchos fenomenos que explicamos en forma sencilla, permitiendo ser comprendida por la 
mayoria de las personas, pues sigue siendo una funcion facil de aplicar. 


Ahora nos dedicaremos a desarrollar y explicar la llamada regresion parabo ica simp e aplicada 
cuando aquellos fenomenos que se observan en un diagrama de dispersion , presentan una concentracion 
de puntos inicialmente ascendente y en seguida descendente (puede darse lo contrario). Esta regresion 
parabolica es utilizada, en gran parte, por los economistas en el analisis de funciones de utilidad, ingre- 
sos, etc. 


La ecuacion general de la parabolica es 


f — a 2 4- b + c 


COSTO 

PRODUCCION 

(miles mill. ) 

(miles mill. ) 

23 

32 

36 

48 

48 

57 


Siguiendo el procedimiento de los minimos cuadrados, 
calcularemos a, b y c para los siguientes 10 pares de 
observaciones de datos tornados en forma arbitraria, 
pues nos interesa mostrar los procedimientos, formulas 
y calculos que se deben realizar en su aplicacion. 


ontin a 
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ontinuacion 


56 

70 

38 

30 

26 

20 

10 

70 

86 

46 

40 

36 

32 

26 

i 

i 


i 

2 

3 

4 

i 

2 

■ ■ 

2 

23 

529 

12.167 

279.841 

32 

1.024 

736 

16.298 

36 

1.296 

46.656 

1.679.616 

48 

2.304 

1.728 

62.208 

48 

2.304 

110.592 

5.308.416 

57 

3.249 

2.736 

131.328 

56 

3.136 

175.616 

9.834.496 

70 

4.900 

3.920 

219.520 

70 

4.900 

343.000 

24.010.000 

86 

7.396 

6.020 

421.400 

38 

1.444 

54.872 

2.085.136 

46 

2.116 

1.748 

66.424 

30 

900 

27.000 

810.000 

40 

1.600 

1.200 

36.000 

26 

676 

17.576 

456.976 

36 

1.296 

936 

24.336 

20 

400 

8.000 

160.000 

32 

1.024 

640 

12.800 

10 

100 

1.000 

10.000 

26 

676 

260 

2.600 

357 

15.685 

746.479 

44.634.481 

473 

25.585 

19.924 

992.914 


Las ecuaciones que seran consideradas para hallar: a,b,c y los respectivos reemplazos en las ecua- 
ciones, se dan a continuacion: 


Ecuaciones normales 

(1) Xy, = aLx i 2 + blLx f + nc 

(2) Ex, y f = aXx 3 + Z>Xx 2 + cXx, 

(3) Xx 2 y ( = aXx 4 + bZx 3 + cZx? 


Reemplazando se tiene: 


(1) 473 = 

15.685a + 357 b 

+ 

10 c 

(2) 19.924 = 

746.479a + 15.6856 

+ 

357c 

(3) 992.914 = 

44.634.481a + 746.4796 

+ 

15.685c 


Comenzamos por eliminar a c para ello trabajamos con las ecuaciones (1) y (2) multiplicando la 
ecuacion (1) por -3,57 y la resultante se la restamos a la (2). 


(2) 

19.924 = 

: 746.479 a 

+ 15.6856 

+ 357c 

(D- 

-16.886,1 = 

-559.954,5 a 

- 12.744,96 

- 357 c 

(4) 

3.037,9 = 

186.524,5a 

+ 2.940,16 

0 


Mediante la operacion anterior obtuvimos la ecuacion senalada como (4). 


Ahora, procedemos con las ecuaciones (1) y (3), multiplicando la primera por 1.568,5 y se la res¬ 
tamos a la (3). 
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(3) 992.914 = 44.634.481a 746.479/? + 15.685c 

(1) -741.900,5 = -24.601.922,5a - 559.954,5 b - 15.685c 
(5) 251.013,5 = 20.032.558,5a 186.524,5 b 0 


Se obtuvo la ecuacion (5). Procedemos a eliminar b para ello multiplicamos a la ecuacion (4) por 
63,4415496 y se la restamos a la ecuacion (5). 

(5) 251.013,50= 20.032.558,50a+186.524,5/? 

(4) -192.729,08= 11.833.403,32 a-186.524,5/> 


a = 


58.284,42 = 
58.284,42 


.199.155,18a 
= 0,0071 


0 


8.199.155,18 

Reemplazamos en la ecuacion (4) y despejamos b 
(4) 3.037,9 = 186.524,5 (0,0071) + 2.940,1 b 
b = 3.037,9-186.524,5(0,0071) =Q ^ 


a = 0,0071 


b =0,5828 


2.940,1 

Reemplazamos los valores de a y b en la ecuacion (1) para obtener el valor de c 
(1)473 = 15.685(0,0071) + 357 (0,5828) + 10c 
473-15.685(0,0071) -357(0,5828) 


c =- 


10 


- = 15,3577 


c = 15,3577 


La ecuacion general nos queda: 


Y = ax 2 + bx + c 


7 = 0,0071jc 2 + 0,5 828jc+15,3577 


Ahora, si queremos estimar el valor de la produccion ( ) en funcion del costo, considerando a =20 
miles de millones de pesos se tendra: 

Y = 0,0071 (20 2 ) + 0,5828 (20) + 15,3577 = 29,86 millones de pesos, sera el valor estimado para 
esa empresa. 


El resultado, se le denomina estimador puntua , pero lo mas aconsejable es calcular el estimador 
por inter a os , fijando un nivel de seguridad o confianza, por ejemplo del 95%, lo cual requiere en primer 
lugar calcular la arian a residua y luego la des iacion tipica residua veamoslo: 


2 _ Uy-YY 

•V “ „ ' 


es la formula mas utilizada y por ende la mas engorrosa para calcular, de ahi 


que procedamos a utilizar otras formulas que sean mas rapidas y simplificadas. 


^2 _ 


reemplazando se tiene: 


o2 _ 25.585 - 15,3577(473) - 0,5828(19.924)-0,0071(992.914) 

Sl.Y ~ 1 /A 


= 34,06 


10 
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S yx =V 34,06 =5,84 


Nos quedan por calcular los limites con una confianza del 

5,84 


Y ± t —& 
yjn 


31,76 ± 2,262- 


Vio 


31,76 ±4,18 


95% 

|35,94 

127,58 


v = n -1 = 10-1 = 91 

~ = 0,05 j to ’ 05 


2,262 


Se observan limites bastante exagerados, quizas por ser n tan pequena; para estar mas seguros sobre 
el uso o no de la regresion parabolica, calculamos el coeficiente de correlacion: 


r>2 _ 1 VR 

R - l ~w 


S 

R 2 = 1 —f- 
s > 


=^> R 2 = 1- 2 4 ’ 0 ^. —=0,89 


321,21 


S 2 = VT = ^- r ^- 

y n 




25.585 - 10 ^^ 
10 


= 321,21 


Por lo tanto 


= r = Yr 2 


-=^0,89 =0,94 Considerado regular la relacion. 


Ejemplo 1. A pesar de que en el ejercicio de las 5 parejas, en las que se analiza las edades de quienes 
contrajeron matrimonio, no corresponde a un ajuste parabolico, de acuerdo con la observacion en el 
diagrama de dispersion o nube de puntos, sera utilizado como ejemplo, unicamente con el fin de comparar 
los resultados que se pueden obtener mediante las diferentes lineas o ajustes que frecuentemente hacemos: 


Tabla 12.6 Datos y calculos en ajuste parabolicos 


2 

i 

3 

4 

i i 

2 

i i 

Y. 

i 

841 

24.389 

707.281 

667 

19.343 

24,65 

1.225 

42.875 

1.500.625 

1.190 

41.650 

32,00 

841 

24.389 

707.281 

754 

21.866 

24,65 

1.444 

54.872 

2.085.136 

1.140 

43.320 

33,34 

1.600 

64.000 

2.560.000 

1.400 

56.000 

33,36 

5.951 

210.525 

7.560.323 

5.151 

182.179 

148,00 



Calculamos a,byc utilizando el metodo de los minimos cuadrados 

(1) 148 = 5.951a + 171/? +5c 

(2) 5.151 = 210.525 a + 5.9516+ 171c 

(3) 182.179 = 7.560.323 a + 210.525 /? + 5.951c 

Eliminamos a C , trabajando con las ecuaciones (1) y (2), para ello, multiplicamos a la (1) por -34,2 
y restamos a la ecuacion (2). 
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(2) 5.115,0= 210.525,0a +5.951, Ob + 171c 
(1) -5.061,6 =-203.524,2a - 5.848, 2b - 171c 

(4) 89,4 = 7.000,8a + 102,86 

Ahora se procede con las ecuaciones (1) y (3), para ello eliminamos a C, multiplicando la ecuacion 
(1) por -1.190,2 y se la restamos a la (3) 

(3) 182.179,0= 7.560.323,0a + 210.525,06 + 5.951c 
(1) 176.149,6 = 7.082.880,2a - 203.524,26 - 5.951c 

(5) 6.029,4= 477.442,8 a + 7.000,86 

Ahora procedemos a multiplicar a la ecuacion (4) por 7.000,8 y a la ecuacion (5) por -102,8 y asi 
eliminamos al coeficiente (6) y obtenemos el valor de a. 

(4) 625.871,52= 49.011.200,64a + 719.682,246 

(5) -619.822,32 = -49.081.119,84a - 719.682,246 

6.049,20= -69.919,20 a 0 

6.049,2 „ ,, 

a= ~ 69.919,2 = ~ 0,0865 «=-0,0865 


Reemplazamos en la ecuacion (4), por lo tanto se obtendra el valor de b. 

(4) 89,4 = 7.000,8(-0,0865) + 102,86 => b = 89 ’ 4 ,t 6 ° 5 ’ 57 = 6,76 

102,8 

Si reemplazamos en la ecuacion (1) se tendra el valor de c. 

(1) 148 = 5.951 (-0,0865) + 171(6,76) + 5 c de donde c sera igual a: 


148 + 514,76-1.155,96 
5 


98,64 


C =-98,64 


La ecuacion para la parabola sera: Y = — 0,0865 2 + 6,76 — 98,64 

Cuando = 29 se tendra con la ecuacion anterior que Y = 24,65 

Cuando = 35 se tendra que Y = 31,997 y asi sucesivamente ( er tab a No 12 ) 
Con los datos de la siguiente tabla se haran otros calculos de importancia. 


Tabla 12.7 Estimativos y desviaciones 


Y. 

i 

-Y. 

i i 

( -Y ) 2 

2 

i 

24,65 

-1,65 

2,7225 

529 

32,00 

2,00 

4,0000 

1.156 

24,65 

1,35 

1,8225 

676 

33,34 

-3,34 

11,1556 

900 

33,36 

1,64 

2,6896 

1.225 

148,00 

0 

22,3902 

4.486 
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Varian a residual o no explicada 


El procedimiento generalizado de calculo es exactamente igual al utilizado para la recta de regresion, es 
decir: 


s(y,-^) 2 


2 = SQy-jy 

+ n-2 


4 = 22^902 = 4,48 


o 22 2902 

4 = - 7,46(Corregida) 


Tambien se puede calcular en forma directa, mediante la aplicacion de la siguiente formula: 


2 _ Xy, - cZy, - x, - flZj, X, 
+ n 


Reemplazando se tiene que: 

^2 _ 4.486 -(-98,64) (148) - 6,76 (5.151) - (-0,0865) (182.179) 

, 224435^^9 


22,4435 _ 22,4435 


n-2 


3 — 7,48 (corregida) 


Error estandar de estimacion 


Ya se vio en la recta de regresion, que el calculo del error estandar de estimacion se obtiene mediante la 
raiz cuadrada a la varianza residual. 

S yx = ^4,49 = 2,12 para n = 5 
S yx = ^7,48 = 2,73 para n-2 

Limites de confianza para Y 


Cuando el estimador se calcula con base en un valor para , es decir, la variable independiente, se tendra 
que: 


Y±t ,-2 4 

1 

1 ( x-x ) 2 

U Lx 2 (L + 2 

I 

n 


asi, cuando 


= 29, se tendra que: 


7 = 24,65 + 3,182(2,73) 


1 + I+J 29 " 34 ’ 2 ) 


5.951- 


(171) 


= 24,65 ± 10,5 


J35,15 

[14,15 


Cuando el valor de se toma como promedio, se fijan los limites de confianza asi: 
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7 = 24,65 ± 3,182(2,73) 



(29-34,2) 2 


5.951 — 


(171) 2 


= 24,65 + 5,91 


J30,56 

[18,74 


La formula que se aplico corresponde a 

Coeficiente de correlacion parabolico 

El proceso mas facil para calcular el coeficiente de determinacion parabolico o coeficiente de correlacion 
al cuadrado sera: 





1 ! (X-X) 2 

n Zx?-^ 2 
n 


(R) 


»2_, VR 
R - l ~VT 


, 4,49 

R 2 = 1--^—= 1-0,17 = 0,83 


2 _ £ (y, - y ) 2 _ 105,2 




26,3 
= 26,3 


n -1 4 

= es el coeficiente de correlacion parabolico. r = ^/0,83 = 0,91 


Veamos ahora como se procede a trabajar con la regresion Parabolica (simple), utilizando la sim- 
bologia que nos permite en un solo ejercicio estimar el valor de 7y el de X , sin necesidad de in ertir e 
orden de as ariab es procedimiento que solo permite hacer los calculos siempre estimando la variable 
que identificamos como 7 


Regresion parabolica simple (empleando otra simbologia) 


En la regresion rectilinea, simple y ponderada, se trabaja con un sistema de ecuaciones con dos incognitas, 
que corresponden a los parametros b y c - en la regresion de “2 en 1” b y c en la regresion de 44 1 
en 2”. Para la regresion parabolica, simple y ponderada, se tendran, tres ecuaciones con tres incognitas: 
a ,b y c en la regresion parabolica de 44 2 en 1 Las ecuaciones en la regresion parabolica simple son: 


7 = 


a n x2 + b yx X + C J* 


(ecuacion general) 


Sistema de ecuaciones en la regresion parabolica simple de 44 2 en 1 ” 

(1) £y, = a yx Lxj + b^lLx, + nc ys 

(2 ) ^y,x, = a yx Z.x] + b yx Zx 2 + c yx lx, 

(3 )Zy,x 2 = a yx Lxt + b y £x] +c yx I jc, 2 


En la regresion parabolica de 44 1 en 2”, la ecuacion general, es: 



Las ecuaciones para obtener los parametros: a b y c 
(DSx, = a x y Lyf + b xy 'Ly t + nc xy 



























CAPfTULO DOCE 

REGRESION Y CORRELACION 


(2 )^x,y = a xy Lyf + b^yf + c xy 'Ly l 

(3 )Zx,y*= a^y , * * * 4 + b^Ltf + c xy Yy , 2 


Consideremos un ejercicio pequeno para calcular los parametros en la regresion parabolica de “1 
en 2” 


Tabla 12.8 Datos y calculos en ajuste parabolico 


2 

i 

3 

i 

4 

i 

i i 

2 

i i 

2 

i 

1 

1 

1 

2 

2 

4 

9 

27 

81 

18 

54 

36 

16 

64 

256 

32 

128 

64 

36 

216 

1.296 

60 

360 

100 

36 

216 

1.296 

84 

504 

196 

98 

524 

2.930 

196 

1.048 

400 



Calculamos los parametros con base en la informacion de la tabla anterior: 

(1) 40 = 98 a xy + 20 b xy + 5 c xy 

(2) 196 = 524 a xy + 98 b xy + 20c x> 

(3) 1.048 = 2.930 a xy + 524 b xy + 98 


Trabajamos con las dos primeras ecuaciones, multiplicando la primera por -4 y se le restan a la 
ecuacion (2) 

(2) 196 = 524 a xy + 98 b x> + 20 c xy 

(1) -160 ^ - 392 - 80/y - 20 

(4) 36 = 132 a xy + 18 b xy 0 


Luego trabajamos con la primera ecuacion (multiplicada por -19,6) y la tercera ecuacion 

(3) 1.048 = 2.930 a xy + 524 b xy + 98 C]cy 

(1) - 784 = -1.920,8 a xy - 392 b xy -98 c A> 

75) 264 = 1.009,2« x> +132 h xy Q - 


Ahora procedemos con las ecuaciones (4) y (5) y multiplicamos la (4) por 132 y la (5) por 18. 


(5) 4.752= 18.165, 6a xy + 2.376 b xy 

(4) -4.752 = -17.424a x> -2316b xy 

0= 741,6 a xy 0~ 


a = 0 

xy 


Este resultado se debe a que los datos se ajustan a una regresion rectilinea y no a una parabola. Con 

la ecuacion (4) determinamos el valor del parametro b 

(4) 36 = 132(0)+ 18 b xy =+ 36 = 18 b xy =+ b xy = || = 2 
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(1) 40 = 98(0)+ 20(2)+5c 




40-40 




C =0 

yy 


La ecuacion genera X = a 2 4- b 4- c =$ X = (0) 2 4- 2 . 4- 0 
Cuando =40, X es igual a 80 X = (0) (160) 4- 2(40) 4- 0 = 80. 

El calculo de la arian a residua se puede obtener con la aplicacion de las siguientes formulas: 


,2 JUy-Y? 


,2 _ E(x, -X,) 2 

yx n 


xy n 


Tambien se puede aplicar y parece mas facil su calculo. 



Calculemos la varianza residual aplicando la ultima formula. 

2 _ 400 - (0) (40) - 2 (196) - (0) (1.048) _ 400-392 _ 8 ^ 

5 5 5 ’ 

El coeficiente de correlacion parabolica , se obtendra en la siguiente forma: 

r= ]l'~if = ^~ 0,1 =Vo^o "=°’ 95 

Siendo:,9 A 2 =^-x 2 = i50-^J=i6 S 2 =16 => s x =Ji6=4 



REGRESION PARABOLICA PONDERADA 


Se presentaran las formulas generales de las ecuaciones de regresion parabolica y las del sistema de 
ecuaciones normales para el calculo de los parametros, la varianza residual y el coeficiente de correlacion 
al cuadrado. 


Ecuacion general: 


Y = 


a ys x2 + b y* x + c » 


X-- 


xy 


y 2 + b xy y + c . 


xy 


Sistema de ecuaciones para la regresion de Y en funcion de 
z ", = a y] Zx? n, + b y Ex, n, + c >jr E«, 

Zx,y,n, = a yx l,xf n, +b yx I.xf n, +c yx I.x l n, 

Ex 2 y, n, = a yx T,xf n, + b yx Ex, 3 n, + c yx Ex 2 ra, 
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Las ecuaciones en la regresion de X en funcion de seran: 

Zx, n, = a xy Xyf n, + b xy Xy, n, + c xy Xn, 

Xy, x , n, = a xy Xyf n, + b xy Xyf n, + C;r> Xy,n, 

Xy] x, n, = a xy Xyf n, + b xy Xyf n, + c xy Xyfn , 

Las varianzas residuales se expresan asi: 



El coeficiente de correlacion al cuadrado o coeficiente de determinacion sera igual a: 


s 2 

R 2 =1-^ = 1-^L 


Ejemplo 1 . Con los siguientes datos, se pide determinar las ecuaciones de regresion parabolica ponderada 
y el coeficiente de correlacion. 


i n i 

n. 

i i 

. n. 

i i i 

2 n. 

l l 

2 n. 

4 

2 

4 

2 

8 

16 

8 

16 

8 

32 

20 

15 

60 

45 

80 

24 

4 

24 

4 

144 

18 

6 

36 

12 

108 

12 

6 

36 

18 

72 

28 

8 

56 

16 

196 

14 

8 

56 

32 

98 

136 

57 

288 

137 

738 




Y-ci yx x 2 +b yx x + c yx 
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1 ) ly, n, = a yx lx] n, + b yx lx,n,+ nc yx 

2 ) ly t x, n, = a yx lx] n, + b yx lx] n, + c >A 1.x,n, 

3) 1 y, x] n, = a yx lx* n, + b yx lx] n, + c yx lx]n, 


Reemplazando se tiene que: 

1 ) 57 = 738 a yx + 136 b yx + 30 c yx 

2) 288 = 4.402 a yx , + 13U yx + 136c >v 

3) 1.640= 27.510a vv + 4.402/? vv + 738c vv 



1 )lx,n i = a xy ly] n, + b xy ly , n, + nc xy 

2 ) Ex, y, n, = a xy ly] », + b xy ly] n, + Cj> ly,n, 

3) 1 x, y] n, = a xy ly] n, + b xy ly] n, + c xy ly]n, 

Reemplazando en las ecuaciones que se tienen para estimar a X, se observa: 

1 ) 136 = 137a A> + 57 b xy + 30c xy 

2) 288 = 387a^ + 137Z> A> + 57 c xy 

3 ) 740 = 1.205« r> + 387 b xy + I37c xy 

Hagamos el proceso para hallar a y c para obtener la ecuacion de Y, inicialmente tomamos las 
ecuaciones (1) y (2), las multiplicamos por 136 y 30 respectivamente a fin de eliminar a c restando de la 
ecuacion ( 2 ) la ecuacion ( 1 ). 

2) 8.640 = 132.060^+ 22.140 b yx + 4.080c >x 
1 ) -7.752 = -100.368a >x - 18.4966 >x - 4.080c >x 

4) 888 = 31.692a >A . + 3.644Z> >X 0 

Ahora procedemos con las ecuaciones (1) y (3), para lo cual multiplicamos la ecuacion (1) por 24,6 
y luego se la restamos de la ecuacion (3) 

3 ) 1.640,0 = 27.510,0a >x 4402,0 b yx 738 c >A 

1 ) 1.402,2= -18.154,8a >A - 3.345,6 b yx - 738c, A . 

237,8 = 9.355,2a, r 1.056,4^,,. 0 

Se procede a trabajar con las ecuaciones (4) y (5) a fin de determinar el valor para a . se multiplica 
la ecuacion (4) por 1.056,4 y la ecuacion (5) por 3.644. 

5) 866,543,2 = 34.090.348,8<x, + 3.849.521,6Z> 

y-A yji 

4) -938.083,2 = -33.479.428,8a... - 3.849.521,66... a >* = -°> 12 

/ yx yx 

610.920a,, 


-71.540 


0 
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a 


y x 


-71.540 

610.920 


= -0,12 Reemplazamos en la ecuacion (4) con lo cual obtenemos que: 


(4) 888 = 31.692 (-0,12)+ 3.644^ => b pc = 888 + ^ 3 - 04 = i >29 


Ahora reemplazamos en la ecuacion (1) b yx - 1,29 
( 1 ) 57 = 738(-0,12) +136(1,29)+ 30c >x 


57 = -88,56+175,44 + 30c v 


C vr = 


57 + 88,56-175,44 
30 


= -0,996 


La ecuacion sera 7 = - 0,12 2 + 1,29 — 0,996 c =-0,996 


En cuanto al calculo de la varianza residual, se procedera asi: 

2 137+0,996 (57)-1,29(288)+0,12(1.640) 

^ =-30-= °’ 64 


La des iacion residua sera: S = ^0,64 =0,80 


La arian a de sera: 


i37 - 3 <§) 


:0,96 


ft 2 Q OQ 

El coeficiente de determinacion: R 2 = 1 —= l - = 0,17 


0,96 


Se deja de ejercicio al lector, establecer la ecuacion de regresion parabolica de X en funcion de , 
lo mismo, el calculo del coeficiente de correlacion para esa estimacion. Observe que el resultado del 
coeficiente de correlacion para la estimacion de X en funcion de , debe ser igual al obtenido, cuando 
se estimo a Y en funcion de . 


EJERCICIOS PARA RESOLVER 


La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

68 . Con la siguiente informacion: 


2k, =174 

'Ly t = 340 

Ex , 2 = 

1.626 

"Lx] =16.110 

Ex , 4 = 167.130 

Ex, 7 , 

= 3.062 

Zxfy, =29.418 

E >', 2 = 5.904 

« = 20 



Se pide: 

a) Estimar el valor de Y cuando =10 mediante la regresion parabolica 

b) Determinar el coeficiente de correlacion parabolica y compararlo con el de la recta. 
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69. Un fabricante quiere establecer si hay una relation parabolica entre las ausencias al trabajo (X) 
(numero de permisos al mes) y la edad del trabajador (Y). Para ello selecciona una muestra de 10 
trabajadores, con la siguiente informacion: 


i : 

28 

32 

46 

24 

28 

36 

42 

37 

51 

42 

i 

5 

8 

4 

7 

10 

4 

3 

4 

3 

4 


a) Estimar la edad para una persona que solicita 6 permisos en el mes. 

b) Calcular el coeficiente de correlacion parabolica. 

c) Fije los limites de confianza del 95%. 


70. En un estudio sobre transporte urbano se quiere predecir, mediante un ajuste parabolico, la capacidad 
que debe tener un vehiculo de servicio (X) de acuerdo al numero de pasajeros que en determinado 
momento debe llevar (Y). Se tomaron 10 vehiculos de diferente capacidad de pasajeros. 


i 

12 

20 

12 

20 

40 

12 

20 

40 

12 

20 

i 

8 

12 

5 

10 

14 

8 

11 

16 

6 

5 


a) Efectuar la estimacion de la capacidad de un vehiculo que lleva 13 pasajeros. 

b) Calcular el coeficiente de correlacion parabolico. 


REGRESION Y CORRELACION EXPONENCIAL Y LOGARITMICA SIMPLE 

Cuando las variables estudiadas presentan un crecimiento o decrecimiento aritmetico, a regresion inea 
es la mas adecuada, pero si hay un crecimiento o decrecimiento geometrico, se debe adoptar la regresion 
e ponencia . 

La funcion e ponencia Y = cb se puede convertir en una funcion lineal cuando trabajamos con 
logaritmos, ya sean neperianos o con base 10, dando como resultado una funcion logaritmica. 


log Y = log c + ( ) log b 


Para la representacion grafica se debe utilizar pape semi ogaritmico cuando la variable X, loca- 
lizada en el eje horizontal o abscisa, se presente en forma de progresion aritmetica, mientras que en la 
ordenada, donde se ubica la variable F, se expresa en forma logaritmica. Si ambas variables tienen cre¬ 
cimiento geometrico, la representation grafica se hace en pape ogaritmico. 

Veamos el calculo y la aplicacion de este proceso de analisis de Regresion e ponencia , en un ejer- 
cicio con datos arbitrarios, asi: 
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Tabla 12.9 Datos y calculos del ajuste exponencial 


2 

i 

log 

/ lo g, 

(log ) 2 

log L 

Y. 

i 

4 

0,47712 

0,95424 

0,22764 

0,60768 

4,05 

16 

0,77815 

3,11261 

0,60552 

0,84063 

6,93 

25 

1,07918 

5,39591 

1,16463 

0,95710 

9,06 

49 

1,38021 

9,66147 

1,90498 

1,19005 

15,50 

124 

1,65321 

19,83855 

2,73312 

1,77241 

59,21 

238 

5,36787 

38,96278 

6,63588 

5,36787 

94,75 



Nota: se debe observar que £ ^ X K. por el contrario X log = £ log Y 


Las ecuaciones normales son: 


(1)2 log , 

= n log c + (I . ) log b 

(2)2 log 

, =(Z ; ) log c + (S , 2 )logfo 


Reemplazando se tiene que: 

(1) 5,36787 = 5 log c + 30 log b 

(2) 38,96278 = 30 log c + 238 log b 

Eliminamos el termino log c, multiplicando la primera ecuacion por -6 y lo restamos a la segunda 
ecuacion, asl: 

(2) 38,96278 = 30 log c + 238 log b 

(1) —32,20722 = -30logc - 1801ogb 6 75556 

—----- => log b= ' = 0,11647 

6,75556= 0 581og6 58 


Ahora, reemplazaremos en la primera ecuacion y se tendra que: 


(1) 5,36787=51ogc+30(0,11647) => logc = 


5,36787-30(0,11647) Q 


Reemplazamos en la ecuacion general, nos quedara asi: log Y. = 0,37475 + (0,11647) 

Ahora si deseamos estimar a Y cuando = 10, se tendra que: 

log f = 0,37475 + (10) (0,11647) = 1,53947 Ahora si obtenemos el antilogaritmo se tendra que: 

Y= 34,63 


Y= antilog de 1,53945 = 34,63 
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Calculo de b y c directamente 

Se podra obtener q\ ogb y og c empleando formulas que permiten calcularlos directamente, asi: 


= nlxilogy, - (lx,)(Ilogy,) 
S nLx 2 -(Lx,) 2 


. , 5(38,96278)- 30 (5,36787) 

log/) =- - -= 0,11647 

5(238)- (30) 2 


logb = Xx,logy, -M(x)(logy) 
Lx 2 -MX 2 


38,96278-5(6)(1 07357) = 47 

238-5(6) 2 


lOgC : 


Zlogy, - logMZx,) 


logc = log y, - log b(x) 


log c = 5,36788-(0,11647)(30) _ Q 3?4?5 


logc = 1,07357 - (0,11647) ( 6 ) = 0,37475 


La media de los logaritmos de . es: 


logy : 


^log y. 


- - 5,36787 , 

log 3 ; =-= 1,07357 


Por otra parte, pueden haber pequenas diferencias en los resultados, aplicando diferentes formulas, 
dependiendo de los decimales que se empleen en los calculos, especialmente cuando utilizamos calcu- 
ladoras. 


b = antilogaritmo del logaritmo de b 
b = antilogaritmo de 0,11647 => b = 1,30758 

Varian a residual y error estandar de estimacion 


Comencemos aplicando la formula que se utiliza con mayor frecuencia en los textos de estadistica, 
siendo: 


2 _ £(logy,-logf ,) 2 


3 A-log y 


0,0874684 

5 


= 0,01749368 


La varianza residual la calculamos mediante las siguientes operaciones 


Tabla 12.10 Estimativos y desviaciones - Exponencial 


log 

logy. 

log ,.-iogy. 

(log ,-log tf 

0,47712 

0,60768 

-0,13056 

0,0170459 

0,77815 

0,84063 

-0,06248 

0,0039038 

1,07918 

0,95710 

0,12208 

0,0161493 

1,38021 

1,19005 

0,19016 

0,0361608 

1,65321 

1,77241 

-0,11920 

0,0142086 

5,36787 

5,36787 

0 

0,0874684 
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Puede observarse que Z log .= Z logT., es decir que la diferencia es igual a cero. 
Ademas 


Z .*Z Y. 


, se puede decir que: 


■ 17.^0 


Tambien se puede calcular la varianza residual, mediante las siguientes formulas: 


log y - ^log> (1 ^ ) 


Siendo S 2 log = 0,17461(1- 0,9012) = 0,017251 


^ x log y ' 


Z(logj,) 2 - logc(Elogj;,) - log 6 (Ex, logy,) 


reemplazando se tendra que: 


o2 _ 6,63588 - (0,37473) (5,36787) - 0,11647 (38,96278) _ A 

^ x log y J -0,01/2// 

Es de anotar que la varianza de la variable se obtiene asi: 



6,63588-5(1,07357) 2 


log> " 


: 0,17462 


Coeficiente de correlacion al cuadrado 

Se puede obtener por diferentes formulas, entre otras se tiene: 


^2 _ | 11 x log y 


log> 


,,=| -S =0 » 12 


Siendo el Coeficiente de correlacion r = ^0,9012 = 0,9493 = 0,95 
Tambien lo podemos obtener mediante la siguiente formula: 


Y — 


n Ex, logy, 

- (Ex,)(Elogy,) 


/ — 

V 

'i 

[»Ex, 2 - 1 2-t,) 2 J[/;E(1 ogy,) 2 -(Elogy,) 2 J 


r =— 


5(38,96278) 

-(30) (5,36787) 



= 0,9493 = 0,95 


V [5(238) - (30) 2 ] b(6,63588)—(5,36787) 2 ] 

R 2 = 0,9012 

Algunos autores denominan al coeficiente de correlacion (de cualquier ajuste) como coeficiente de 
corre acion de Pearson. 


REGRESION Y CORRELACION MULTIPLE 


Cuando se trabaja con mas de dos variables independientes, relacionadas entre si, el analisis de regresion 
recibe el nombre de regresion m tip e. El grado de relacion que puede haber entre estas variables es 
cuantificado, mediante el calculo del coeficiente de correlacion multiple. 

En estadistica con fines de explicacion y aplicacion, por lo general se trabaja con dos variables 
independientes, esto permite la realizacion de operaciones menos engorrosas que trabajando con mas de 
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dos, lo que obligaria a la aplicacion del algebra matricial o al manejo de algunos paquetes estadlsticos 
que contienen programas de regresion, entre otros SPSS, TSP, SAS, MICROSTAT y otros mas, que no 
son muy comunes para los lectores de estos apuntes. 

La expresion de la funcion utilizada en la regresion multiple es variada, como se puede ver a con- 
tinuacion: 


(1) Y — a -\-b x X x + b 2 A 2 + 6 3 -A 3 ... 

(2) Y = !3 n +li [ X,+p 1 X 1 + p,X i ... 

(3) A, = ^ 1.23 ^12.3 X 2 ^13.2 X 3 *” 

la (3) sera la simbologia que utilizaremos en esta unidad. 


A los parametros b { b 2 b 3 6 (B 1 (3 2 o 6 123 6 132 se les denomina coeficientes de regresion. El 

coeficiente b , /?, b , mide la cantidad (+/-) que aumenta o disminuye la variable dependiente Y 6 X v 
cuando la primera variable independiente A aumenta en una unidad, manteniendo constante los otros 
coeficientes; lo mismo puede decirse para los demas coeficientes de regresion, siempre que las demas 
variables independientes en la ecuacion permanezcan constantes. Los coeficientes de regresion miden las 
elasticidades de la variable dependiente con respecto a la variable. 


Ejemplo 1 . Veremos como se opera utilizando este sistema de ecuaciones para el calculo de los 
parametros, tomando la ecuacion general para 7, como ejercicio de aplicacion. 


Tabla 12. 11 Datos y calculo en la regresion multiple 


i 

i 

2 

2 

3 

5 

3 

5 

8 

5 

8 

12 

9 

10 

15 

11 

14 

20 

30 

40 

60 



Y = a + b l x l + b 2 x 2 


( 1 ) YLy f = na-\-b l 'Lx x -\-b 2 'Lx 2 

( 2 ) 'Zy t x l = aYuX x + x x + b 2 Hx x x 2 
(3 )I,y l x 2 = a'Lx 2 +b l 'Lx l x 2 +b£x 1 2 


30— 5o + 40 b x + 60^2 
305 = 40a+ 3946 + 5816 2 
449 = 60 a + 5816 + 8586 2 


Multiplicamos la ecuacion (2) por -8 y se la restamos a la (1) 


(2) 305 40 a + 394 + 581 b 2 Procedemos a multiplicar por-12 la ecuacion (1) y se 

( 1 ) - 240 = -40a - 320Z>! - 480 b 2 la restamos a la ecuacion (3). 

(4) 65 = 0 + 74Z>! + 1016 2 
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(3) 449 = 60a + 581^ + 8586 2 

(l)-360 = -60a - 4806, - 7206 2 
(5) 89 = 0 + 1016, + 138 b 2 

(5) 6.586 = 7.4746, + 10.2126 2 

(4) -6.565 = -7.4746, - 10.2016 2 


21 = 0 116 2 


Con la ecuaciones (4) y (5) procedemos a eliminar 6 


(Se ha multiplicado la ecuacion (5) por 74) 
(Y multiplicamos la ecuacion (4) por -101) 

=> 6 2 =y| = 1,909 


Reemplazamos en la ecuacion (4) y se tiene que: 

( 4 ) 65 = 746, + 101(1,909) => 6 , = 65 ~ 1.909(101) = _ lj72? 

Conociendo 6 =— 1,727 y b 2 = 1,909 , reemplazamos en la ecuacion (1) 
30 = 5a + 40 (-1,727) + 60 (1,909) 


30 = 5a - 69,08 + 114,54 => a = 15 ’ 46 = - 3,092 

Los valores de los coeficientes de regresion son: = b { = —1,727 /? 2 = Z ? 2 = 1,909 y a- — 3,092 

La ecuacion general nos queda: Y— — 3,092 — 1,727 x + 1,909 2 

Si le damos valores arbitrarios a x = 10 y 2 = 15 , se tendra que 
Y= - 3,092 - 1,727 (10) + 1,909 (15) = 8,273 


La varianza residual sera: 


Uy L -tr 


>S7, r =0,418 

>•* 1*2 ’ 


y su desviacion es: S = 0,418= 0,65 


El coeficiente de corre acion m tip e de en fimcion de 1 y 2 se obtiene en forma simplificada 
mediante la formula: 



A = J 1 


0,42 
' 12 


0,98 


Los limites de confianza seran: 


R 2 = 0,965 = 0,97 


Y±t 


*^>•*1 *2 

4n 


8,273 ± 4,303 


0,65 

s 


=> 8,273 ± 1,25 


[9,47 

[7,02 


Algunos trabajan con v—n— 1 = 5 — 1=4 grados de libertad otros, con: v=n — 3 = 5 — 3=2, 
en este caso t = 4,303 a un nivel de significacion del 5%. 
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CALCULO DE ESTIMATIVOS APLICANDO OTRA SIMBOLOGIA 

Veamos como algunos trabajan, en primer lugar, cambiando de posicion a Yi dependiendo de la variable 
que se desea estimar: 


(1) 

Y, 

X i 

X 2 

(2) 


Y, 

X 2 

(3) 


X,2 



En estos casos, se estima Y en fimcion de las otras dos o mas variables, donde siempre se estara 
utilizando la misma ecuacion general y el procedimiento de calculo de los coeficientes de regresion se 
hara de la misma manera. 


A1 principio del tema sobre regresion corre acion m tip e se presento la ecuacion general de tres 
formas diferentes, ahora de ellas seleccionamos la tercera, considerandola con X y 

Veamos el proceso de calculo trabajando con la simbologia de la ecuacion (3) 

Las variables las simbolizamos por 1 2 . y los coeficientes de regresion de X 

] por b {23 , b l23 , b U2 que son constantes, denominados tambien parametros, cuando son aplicadas en 
poblaciones. Para los de X 2 son: b 2X3 b 2X3 b 23 1 y para X 3 son b 3n b 3X2 b 32X . 


1 = Primera variable j w Segunda variable = Tercera variable. 

b {2 = Coeficiente de regresion parcial de , (coeficiente angular) sobre manteniendose 

constante 3 (coeficiente angular). 

b X3 2 = Coeficiente de regresion parcial de 1 sobre manteniendose constante 2 (coeficiente 
angular). 

b x 2 = Coeficiente de posicion de la primera variable en fimcion de la segunda y tercera variable. 


La ecuacion X x =b l23 + ^ 123*2 + ^i 3 . 2 x 3 se denomina ecuacion de regresion inea deX 1 sobre 
y 3 . Las ecuaciones generales paraX 2 yX 3 son: 


X 2 — ^ 2.13 ^ 21.3 X \ ^ 23.1 X 3 


X3 — ^3.12 ^31.2 X l ^32.1 X 2 


Para obtener los coeficientes de regresion parciales , hay necesidad de resolver un sistema de ecua¬ 
ciones normales. 


— b\23 +bl2.3 X 2 ^ 13.2 X 3 


a) Hx l = nb l23 + b U3 Xx 2 + b l32 lLx 3 

b) Xx l x 2 = b l23 Xx 2 + b l23 Xx\ + b l32 Xx 3 x 2 

C ) L X j X 3 — b y 23 L X3 "I - ^12 3 ^ X 2 X 3 "P ^13 2 ^ X 3 


Para la regresion lineal de X 2 en fimcion de { y se tiene que: 

Las ecuaciones para hallar los parametros son: 
a) Xx 2 -nb 


^2 — ^2.13 ^21.3 X \ ^23.1 X 3 


2.13 


+ b 2L3 LX, + 623 .! LX 3 

Zj) Lx 2 x^ — b 2 J3 Lx^ b 2 \ 3 Lx^ -l- b 23 ^ Lx^x^ 

c ) Lx 2 x 3 = 


! ^3 +b 21.3 + *23.1 ^*3 



























CAPfTULO DOCE 

REGRESION Y CORRELACION 


641 


En la regresion lineal de X 3 en funcion de t y 
Las ecuaciones para hallar los parametros, son: 


se tiene: 




: * 3.12 + * 31.2 ' 


+ b 


32.1 *2 


a) Zx 3 = nb 3l2 + b 3l2 Hx l + & 321 Zx 2 

b) Xx 3 x l = b 3l2 'Lx l + b 3l2 Xxl + b 32l 'Zx 2 x l 

c) Hx 3 x 2 = b 312 Xx 2 + b 3l2 'Zx l x 2 + b 32l 'Zx 2 


Se puede simplificar la simbologia usada en los tres casos anteriores, de la siguiente forma: 

* 1.23 * 2.13 * 3.12 -> P° r a 

* 12.3 * 21.3 * 31.2 porb 

* 13.2 * 23.1 * 32.1 ”> P° r C 

Proceso de calculo de los coeficientes de regresion mediante la primera simbologia sigue siendo 
igual al aplicado en el ejercicio anterior: 

a) 30 = 5 b l23 + 406 123 + 60& 132 

b ) 305 = 40^ 23 + 394 £> 123 + 581£> 132 

c) 449= 60 b l23 + 581Z? 123 + 858Z> 132 
Multiplicamos la ecuacion a) por -8 y la restamos a b) 


x x =X 


x 2 =Y 


x 2 =Y 


b ) 305 — 40 b^ 23 + 394 b l23 + 581Z? 132 
a) - 240 = - 40^ 23 - 320& 123 -4806 132 

d ) 65 = 0 + 74Z? 12 3 + 101 b^ 32 

Multiplicamos por -12 la ecuacion a) y la restamos a la c) 

c) 449= 60 b^ 23 + 581 b^ 23 + 85 8Z?^ 3 2 
a) - 360 = - 60^ 23 -480& 123 - 120b l3 2 

e) 89 =0 + 101Z? 123 + 138 b^ 32 

Con las ecuaciones d) ye) podemos eliminar a b {2 3 para determinar b {3 2 
6.586 = 7.474^ 23 + 10.212Z? 132 (multiplicamos por 101) 

— 6.565 = —7.474 b 123 + 10.201& 132 (multiplicamos por-79) 

21= 0 11*13.2 => *13.2 =ff = 1 ’909 

Reemplazamos en la ecuacion d) y tenemos que: 

65 = 74Z? 123 + 101(1,909) 12?R1 

65 = 74Z? 12 3 + 192,809 => -127,809 = 74Z> 123 => b l23 =-= -1,727 


Teniendo b n2 = 1,909 y b V23 = - 1,727 reemplazamos en la ecuacion (a): 


30 = 5 b l 23 + 40 (-1,727)+ 60 (1,909) 

30 = 5^ 23 - 69,8+114,54 => 99,08-114,54= 5^ 23 


*i 


15,43 


.23 ' 


-3,092 


5 
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La ecuacion genera nos queda: X { = — 3,092 — 1,727 2 + 1,909 3 
Si le damos arbitrariamente valores a 2 = 10y 3 = 15 , se tendra que: 

X, =- 3,092 - 1,727 (10) + 1,909 (15) = 8,273 

La des iacion tipica residua de X ] sobre 2 y 3 se calcula mediante la formula: 
^. 23 = ^f^ = VO4l8=0,65 



s \23 = = 0,42 (varianza residual) 

El coeficiente de correlacion multiple de X { sobre 2 y 3 se obtiene: 


*1.23=jl-% 


o2 _ XU - xj 

7 — 

V v 


n 


(varianza) 



R t 23 = ^1--^ = Vl-0,035 = V0,965 = 0,98 

OTRO PROCEDIMIENTO APLICANDO EL METODO DE JORDAN - GAUSS 

Mediante la solucion de un sistema de ecuaciones lineales, utilizando el metodo de Jordan - Gauss, asi: 


a 

5 A, + 40X 2 + 6 O 7 

30 

b 

407 + 3947 + 5817 

305 

c 

6 O 7 + 5817 + 858X 3 

449 

& 

ll 

X x + 8 X 2 + 12X 3 

6 

b l -b- 40 a l 

0 + 74X 2 + 101X 3 

65 

Cj - c- 60a, 

0 + 101X 2 + 138X 3 

89 

a 2 ~ a \ ~ 8^2 

7 + 0 + 1 , 08087 , 

-1.0272 

b 2 =V?4 

0 X 2 + 1,3649X 3 

0,8784 

c 2 - c x - 101Z ? 2 

0 0 + 0 , 1451 X 3 

0,2816 

a 3 = a 2 - 1,0808c 3 

O 

O 

-3,1247 

b 3 = b 2 - 1,3649c 3 

0 X 2 0 

-1,7705 

Cn — / 

/0,1451 

>7 

O 

O 

1,9407 
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Procedimiento 


■ Dividimos la primera ecuacion (a) por 5 y luego con esta ecuacion eliminamos a en 
las ecuaciones bye 

■ El segundo paso consiste en dividir la ecuacion b 2 por 74 y luego con ella eliminamos a 
X 2 en las ecuaciones a x y c x . 

■ Luego, en el tercer paso se trabaja con la tercera ecuacion c 3 la cual se obtiene, dividiendo 
a la ecuacion c 2 por 0,1451, la que a su vez nos permitira eliminar a X 3 en las ecuaciones 

a 2 y b r 


Setendraque X x =b X23 = — 3,1251 X 2 = b X23 = — 1,7705 y X 3 = b X32 = 1,9407 
siendo: X x =- 3,125 - 1,7705 2 + 1,9407 3 

Supongamos que desea estimar el valor para X x cuando 2 = 9 y 3 =14. 

Reemplazando se tiene que: X x = — 3,1251 — 1,7705 (9) + 1,9407 (14) = 8,11 

En cada una de las estimaciones de X x X 2 y X y se puede hallar el coeficiente de correlation 
m tip ey la arian a residua para cada caso, siendo: 



Se ha dicho que el error estandar de estimation o error tipico de estimacion se obtiene mediante 
la raiz cuadrada de la varianza residual. Este error se puede calcular utilizando los coeficientes de co- 
rre acion parcia r X2 r X3 r 23 . Se debe observar que r X2 = r 2X r x = r 3X r 2 = r 32 con el fin de no repetir 
operaciones. 


, _ r, | l r l2 r l3 r 23 + 2r n q 3 ^3 

' L23 11 i i-4 





1 r 21 r 23 r l3 " l " ^ r 21 r 23 r l3 

i - nl 


‘^3.12 _ ^ 

1 r 31 r 32 r l2 + ^ r 31 r 32 r l2 

1 - ^2 


Se tendra que: 
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Los coeficientes de correlation partial se calculan asi: 


= r n = 


nllx l x 2 - (Xx 1 )(Xx 2 ) 


^4 - ][»^2 - ] 


5(305) - (30) (40) 


^^(240) - (30) 2 ][5(394) - (40) 2 ] 


: 0,975 


4 = 0,95 


= 


r 3i r i3 


ilLx x x 3 - (Xx,) (X x 3 ) 




5(449) - (30) (60) 


a /[5(240)-(30) 2 ][5(858)-(60) 2 ] 


■ = 0,978 


r,i = 0,956 


r 32 ~ r 23 - 


nZx 2 x 3 - (Xx 2 )(Xx 3 ) 


- (lx 2 f ][/iIa ' 3 2 - (lA'3) 2 ] 


^32 ~~ ^23 


5(581)-(40)(60) 


^[5(394) - (40) 2 ]^(858) - (60) 2 ] 


: 0,999 


4 = 0,998 


Ahora se podran calcular los errores estandar o tipico para cada estimador, asi: 


S i23 = 346 1 - °* 95 - 0’956 - 0,998 + 2 (0,975) (0,978) (0,999) _ 2 fi? 


1 - 0,998 


^ 23 = 7,14 


„ oc 1-0,95 -0,998 -0,956 + 2(0,975)(0,999) (0,978) 

S 2 13 — 3,85 ,1 --- — nc£ - — 0,63 


1 - 0,956 


4.13 = 0,40 


525 1 - 0,956 - 0,998 - 0,95 + 2 (0,978) (0,999) (0,975) _ Q gl 


1 - 0,95 


S 3]2 = 0,66 


Las des iaciones tipicas respectivamente son: 


1 240-5(6)1,3,46 
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Zx* -nxl _ 394 -5(8) 


= 3,85 


Xx 3 2 - nxl _ /858 - 5(12) z 


= 5,25 


Los coeficientes de corre acion m tip e inea , pueden tambien ser calculados mediante la aplica- 
cion de las formulas siguientes. 



10,95 + 0,956 - 2(0,975) (0,978) (0,999) 
\ 1 - 0,998 


R, 


l r 21 + 4 ~ 2r 2l r 23 r l3 

V I - 'la 


— 


0,95 + 0,998 - 2(0,975) (0,999) (0,978) 


1 - 0,956 


= 0,99 




^3.12 “ ^ 

r 3i + r 32 ^ r 31 r 32 r n 

1 - r n 


1 0,956 + 0,998 - 2(0,978) (0,999) (0,975) 
\ 1 - 0,95 


Recordemos que si el coeficiente de correlacion se acerca a 1, se tendra una mejor relacion lineal 
entre las variables, pero si se aproxima a 0 nos estara indicando que no hay relacion lineal entre las va¬ 
riables, pero es posible que exista entre ellos una relacion no lineal. 

Como observacion a los resultados anteriores de /?, 23 R 213 R 3 ]2 estos no son necesariamente 
iguales, tal como se puede comprobar en el ejercicio que se acaba de desarrollar. 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

71. Una empresa considera que lo mas conveniente para sus actividades, es lograr una participacion del 
24% en el mercado y una utilidad no menor de $345,000,000. 

La informacion obtenida durante diez anos sobre: la participacion en el mercado, el porcentaje de 
descuento que se hace para lograr aumento en las ventas y la utilidad obtenida, sin necesidad de 
hacer reajustes excesivos en el precio, es la siguiente. 
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PARTICIPACION 

ENEL MERCADO % 

DESCUENTO 

CONCEDIDO % 

UTILIDAD 
(en millones de ) 

5 

20 

270 

9 

18 

250 

12 

16 

280 

8 

10 

260 

16 

14 

310 

18 

16 

330 

19 

16 

350 

20 

17 

320 

18 

17 

360 

27 

20 

330 


Se pide: ual debe ser el nivel de descuento por conceder, teniendo en cuenta el nivel de partici¬ 
pacion en el mercado y la utilidad deseada, si la participacion en el mercado es del 35% y 
el descuento que se concede es del 24%?, i que utilidad esperaria? 

72. Con los siguientes datos correspondientes a 6 periodos: 

X l = Consumo de bienes industriales 

X 2 = Ingreso disponible 

X 3 = Importaciones de bienes de consumo 

(La informacion esta dada en unidades monetarias constantes). 

EXj = 308 Ex 1 x 2 = 18.555 Ex 3 x 3 = 4.264 

Ix 2 - 363 Ex 2 = 22.157 Ex 2 =1.145 

E x 3 = 81 Ex 2 x 3 = 4.994 Ex x 2 = 16.152 n = 6 

a) Estimar el valor de X x cuando x 2 = 70 y x 3 = 23 

b) Estimar el valor para X 2 cuando x l = 48 y x 3 = 10 

c) Determinar los coeficientes de correlation parciales. 

73. Siendo: 

EXj= 129 Ex 1 x 2 = 1.996 EXjX 3 = 201,98 

Ex 2 = 79 Ex 2 = 1.279 Ex 2 = 14,1881 

Ex 3 = 7,23 Ex 3 x 2 = 129,39 n = 6 

X { = Precio de bienes agricolas X = Costo unitario de produccion X 3 = Expectativas de inflacion (%) 

Se pide estimar el precio de los bienes agricolas, cuando el costo de produccion es de 40 y la 
expectativa de inflacion del 8%. 

74. Con la siguiente informacion: 

E Xj= 3.247,4 Ex 2 x 3 = 98.060,1 Ex 2 = 604 

E x 3 = 95 Ex 3 Xj= 18.057,0 Ex 2 2 = 30.308 


n = 15 
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Xjc 3 2 = 725 Ex 2 = 939.175,68 Zx 2 x 3 = 3.833 

a) Establezca la ecuacion de regresion para estimar X 2 

b) Obtener el valor estimado para X 2 cuando x x = 210 x 3 = 5 

75. Considere un estudio realizado para examinar el papel que juega la television en la vida de un grupo 
de personas de edades superiores a los 30 anos e inferior a los 50, teniendo en cuenta los anos de 
escolaridad. 



Estime el numero de horas TV., para una persona de 40 anos de edad y 11 anos de escolaridad. 
Determine el coeficiente de correlacion multiple. 


76. Con los siguientes datos: 



Se pide: 

a) Estimar Y 

cuando j =11 y 2 = 16 

b) Determinar el coeficiente de correlacion de Y con base en 


y 2 


COEFICIENTE DE CORRELACION POR RANGOS (ver cap, 9 pg. 460) 

Los coeficientes de corre acion por rangos mas utilizados son los de Pearson y Spearman, este ultimo de 
gran aplicacion en la investigacion de mercados, especialmente cuando se desean investigar preferencias, 
actitudes o atributos, por medio de algun sistema de calificacion que va en orden ascendente de graduacion. 
Puede utilizarse en los fenomenos cuantitativos o variables, sin que estos tengan significado numerico. 

La formula aplicada es r K = 1 - 

n - n 

Nota: en el capitu o , pagina 460 se hace referencia a esta prueba no parametrica , donde el alumno 
podra complementar sus conocimientos. 

□ d. = representa la diferencia entre los rangos pareados de cada par de variantes . y 

□ n = es el numero de rangos o sea el numero de variantes apareadas. 

El procedimiento que se sigue en el calculo del coeficiente, consiste en colocar en orden: primero, 
segundo, tercero, etc., con respecto al valor que toma cada una de las variables y que denominamos rango 
y luego se establece el cuadrado de las diferencias entre los dos rangos que usaremos para el calculo del 
coeficiente de correlacion. 
















648 


CIRO MARTINEZ BENCARDINO 

ESTADISTICA Y MUESTREO 


Ejemplo 1 . Supongamos que una fabrica ordena a sus 15 obreros, de acuerdo con la eficiencia, dos 
trabajos. Se desea calcular el coeficiente de correlacion por rangos entre estos datos. 


TRABAJADOR 

RANGO PARA 

EL TRABAJO I 

RANGO PARA 

EL TRABAJO II 

d. 

d. 

i 

A 

1 

15 

-14 

196 

B 

2 

14 

-12 

144 

C 

3 

13 

-10 

100 

D 

4 

3 

1 

1 

E 

5 

4 

1 

1 

F 

6 

12 

-6 

36 

G 

7 

1 

6 

36 

H 

8 

11 

-3 

9 

I 

9 

2 

7 

49 

J 

10 

7 

3 

9 

K 

11 

8 

3 

9 

L 

12 

5 

7 

49 

M 

13 

6 

7 

49 

N 

14 

10 

4 

16 

0 

15 

9 

6 

36 

- 

- 

- 

- 

740 


r= 1- 


6 (740) 


15 3 -15 




- 1 < l\ < 1 


r =1-1,32 = -0,32 


Siendo - 1 < r % < 1 se puede afirmar que no hay ninguna relacion clara entre los dos rangos. 


Ejemplo 2. Con los siguientes datos, correspondientes a 13 estudiantes aspirantes a ingresar a la 
universidad, calcular el coeficiente de Spearman. 


ESTUDIANTE : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

PROMEDIO Bto : 

6,7 

6,1 

9,2 

6,1 

6,7 

9,2 

7,0 

6,1 

6,7 

7,5 

7,5 

9,6 

7,5 

PUNTAJE ICFES: 

333 

300 

286 

290 

286 

300 

326 

348 

326 

300 

384 

300 

286 


Solution: 

Primero ordenamos las calificaciones de menor a mayor (tambien se puede de mayor a menor) y 
luego establecemos el rango para cada calificacion. 


No. 

X 

1 

RANGO 

i 


RANGO 

y t 


X 

1 

y t 

RANGO 

y t 

RANGO 

X 

II 

i 

Vi 

d, 2 

1 

6,1 

2 

286 

2 


6,7 

333 

5 

11 

-6,0 

36,00 

2 

6,1 

2 

286 

2 


6,1 

300 

2 

6,5 

-4,5 

20,25 

3 

6,1 

2 

286 

2 


9,2 

286 

11,5 

2 

9,5 

90,25 

4 

6,7 

5 

290 

4 


6,1 

290 

2 

4 

-2,0 

4,00 

5 

6,7 

5 

300 

6,5 


6,7 

286 

5 

2 

3,0 

9,00 

6 

6,7 

5 

300 

6,5 


9,2 

300 

11,5 

6,5 

5,0 

25,00 

7 

7,0 

7 

300 

6,5 


7,0 

326 

7 

9,5 

-2,5 

6,25 


ontin a 
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ontinuacion 


8 

7,5 

9 

300 

6,5 

9 

7,5 

9 

326 

9,5 

10 

7,5 

9 

326 

9,5 

11 

9,2 

11,5 

333 

11 

12 

9,6 

11,5 

348 

12 

13 

9,6 

13 

384 

13 


6,1 

348 

2 

12 

-10,0 

100,00 

6,7 

326 

5 

9,5 

4,5 

20,25 

7,5 

300 

9 

6,5 

2,5 

6,25 

7,5 

384 

9 

13 

4,0 

16,00 

9,6 

300 

13 

6,5 

6,5 

42,25 

7,5 

286 

9 

2 

7,0 

49,00 

Z 

- 

- 

0 

424,50 


A1 frente de cada valor de y se coloca el respectivo rango, luego se establecen las diferen- 
cias, se elevan al cuadrado y finalmente se suma esta columna. 


6 d; 
n 3 - n 


, 6 (424,5) 

K = 1 -,- 

13 2 —13 


-0,166 


No hay correlacion alguna entre las calificaciones obtenidas en el bachillerato, con las pruebas del 
ICFES, para ingreso a la Universidad. 


EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 

77. Una firma de compraventa de automoviles desea determinar la relacion que existe entre el puntaje 
de una prueba de aptitud y el numero de automoviles vendidos por cada vendedor en su primer ano 
de trabajo. Una muestra aleatoria de 15 vendedores da la siguiente informacion. 


VENDEDOR 

PUNTAJE PRUEBA 

No. DE AUTOMOVILES 

1 

72 

34 

2 

88 

42 

3 

70 

32 

4 

72 

44 

5 

87 

29 

6 

71 

32 

7 

85 

41 

8 

89 

46 

9 

93 

50 

10 

98 

51 

11 

93 

53 

12 

96 

32 

13 

86 

39 

14 

82 

43 

15 

88 

37 
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Calcular el coeficiente de correlacion de Spearman, como medida del grado de relacion entre el 
puntaje en la prueba y el numero de automoviles vendidos. 
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78. Para medir la reaccion de un grupo de consumidores respecto a la presentacion de un producto, 
se tomaron 12 personas y se les interrogo en cuanto al concepto que les merecia la presentacion 
tradicional de ese articulo; luego se les presento el mismo articulo en su nuevo empaque. Las 
mediciones se efectuaron utilizando una escala de 20 puntos, obteniendose los siguientes resultados, 
para cada una de las 12 personas. 


TRADICIONAL: 

6 

10 

14 

17 

6 

6 

11 

14 

10 

17 

11 

13 

NUEVO: 

10 

13 

18 

12 

9 

8 

12 

18 

17 

10 

18 

20 


Calcular el coeficiente de correlacion de Spearman. 


79. Los datos siguientes corresponden a los costos y ventas, en millones de pesos, de 14 droguerias, en 
una semana: 


DROGUERIA 

COSTOS 

VENTAS 

1 

13 

21 

2 

12 

17 

3 

16 

22 

4 

15 

16 

5 

14 

18 

6 

22 

35 

7 

23 

34 

8 

17 

20 

9 

24 

31 

10 

20 

24 

11 

21 

25 

12 

18 

25 

13 

15 

24 

14 

22 

31 


a) Calcule el coeficiente de correlacion de Pearson por rangos de Spearman 

b) Compare los resultados. ^Cual cree usted que sea el indicado? 

80. Una oficina gubernamental clasifica 14 diferentes marcas de un articulo X de acuerdo a la calidad 
general de ellos. La tabla da el rango asignado a cada marca, asi como tambien los precios promedios 
de cada una (en miles de pesos). 


MARCA: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

RANGO DE CALIDAD: 

11 

1 

2 

5 

3,5 

3,5 

6 

9 

12 

13,5 

9 

7 

13,5 

9 

PRECIO PROMEDIO: 

45 

60 

53 

52 

60 

60 

20 

52 

70 

68 

70 

52 

68 

45 


Calcular el coeficiente de correlacion por rangos, para medir el grado de correlacion entre la calidad 
y el precio. 


81. Supongamos que se desea determinar si las calificaciones obtenidas por los obreros en cierto test, 
se correlacionan con su rendimiento en el trabajo, expresado por el numero de unidades producidas 
en un periodo dado. 


CALIFICACION TEST: 

65 

80 

76 

75 

80 

78 

83 

84 

85 

90 

65 

83 

76 

76 

83 

65 

UNIDADES PRODUCIDAS: 

30 

25 

35 

40 

38 

42 

48 

50 

55 

45 

25 

35 

38 

35 

25 

42 
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Calcular el coeficiente de correlacion por Rangos - Metodo de Spearman. 

Nota: a partir del siguiente ejercicio, se plantean situaciones donde el alumno debe identificar a que 
tema pertenece y dar la solucion correspondiente. 

82. A1 observar los resultados del proceso de sedimentacion o formacion de costras en el interior de 
tubos de gran diametro, que acarrean aguas negras, se construyo la siguiente tabla, con el objeto de 
establecer la comparacion (relacion) entre los anos de servicio y el espesor de las costras formadas 
en su interior: 


ANOS DE SERVICIO 

i 

4 

2 

3 

6 

5 

1 

7 

ESPESOR DE COSTRAS (mm) 

i 

10 

6 

8 

15 

11 

5 

16 


De acuerdo con los datos anteriores, se pide: 


a) Calcular el coeficiente de correlacion. 

b) Se dice que un tubo esta totalmente fuera de servicio por accion del espesor de la costra cuando 
alcanza los 22 mm. los cuantos anos queda fuera de servicio el tubo? 

83. Explique brevemente: 

a) /,La diferencia entre el analisis de regresion y el de correlacion?. ^Cuando debe aplicarse cada 
uno? 

b) lQvlq interpretacion le da usted a la varianza residual y a la varianza explicada? 

c) iQue pasa si la varianza explicada es igual a la varianza total? 

84. Un funcionario de una entidad, que generalmente, presta asesoria a pequenos establecimientos 
donde se reconstruyen pequenos motores a gasolina para bombas hidraulicas, ha realizado un 
estudio acerca de las diferencias entre la habilidad de los trabajadores para aprender el nuevo trabajo 
y su capacidad de realizarlo sin supervision. Despues de varias semanas, ha obtenido la siguiente 
informacion, donde Y = produccion mensual de motores correctamente reconstruidos y X = anos de 
educacion en cada uno de los 10 trabajadores. 


i 

7 

5 

6 

4 

10 

8 

6 

5 

10 

6 

8 

y ; : 

15 

7 

10 

8 

20 

16 

12 

8 

16 

8 

14 


a) Estime la produccion mensual promedio de motores correctamente reconstruidos por un 
trabajador que presenta en su hoja de vida 9 anos de estudio. 

b) Fije los limites de confianza del 95%, para dicho promedio. 

c) Interprete el coeficiente de regresion y el coeficiente de correlacion 

85. El departamento de personal de una empresa industrial desea estudiar la relacion que hay entre 
varias variables obtenidas en una investigacion. Estas variables son: salario semanal (miles de $), 
tiempo de servicio (meses) y edad de sus empleados (anos). La informacion correspondiente a una 
muestra de 15 de sus empleados. 


EMPLEADO: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

SALARIO: 

61,9 

73,6 

65,8 

86,3 

50,8 

54,2 

66,2 

70,8 

79,0 

54,2 

86,3 

73,6 

64,4 

51,9 

52,0 

TIEMPO SERVICIO: 

330 

569 

375 

113 

215 

343 

252 

265 

352 

87 

220 

160 

42 

30 

130 

EDAD: 

46 

59 

52 

40 

46 

54 

39 

41 

46 

30 

48 

35 

30 

30 

36 
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1. Se pide mediante una regresion lineal simple: 

a) Estimar el salario semanal para una persona con 200 meses de servicio. 

b) Estimar el salario semanal para una persona con una edad de 38 anos. 

c) En los dos casos, como interpretar el coeficiente de correlacion. 

2. Mediante la regresion lineal multiple, se pide: 

a) /,Cual deber ser el salario semanal para un trabajador de la empresa que tiene 260 meses de 
servicio y 53 anos de edad? 

b) Interprete los dos coeficientes de regresion (b { y Z? 2 ) simbolizados tambien como: b l23 y b X32 

c) Calcule el coeficiente de determinacion multiple ( Rf 23 ) e interprete su resultado. 

d) Calcule el error estandar de estimacion multiple para el ejercicio (a). 

e) Establezca una estimacion de intervalo con el 95% de confianza para el salario semanal 
(miles de $) promedio de un empleado que tiene 10 anos de servicio en la empresa y 47 anos 
de edad. 

f) Calcule los coeficientes de correlacion total r , r 213 y r , interprete los resultados. 


EJERCICIOS MISCELANEOS 

(CUBRE TODOS LOS TEMAS DEL CAPITULO) 


86. Marque con una X la respuesta correcta en cada punto: 

A. El coeficiente de correlacion 

a) Es una medida que describe la intensidad de la relacion de dos variables. 

b) Es una medida de posibilidad asociada a un intervalo de confianza. 

c) Es una medida de asociacion entre dos atributos. 

d) Se usa para designar el cuadrado del coeficiente de correlacion. 

e) Es el coeficiente de una variable independiente en una ecuacion de regresion. 

B. El error estandar de estimacion. 

a) Es el cuadrado de las diferencias entre los valores reales y estimados. 

b) Es el promedio de los cuadrados de las diferencias entre los valores estimados y la media. 

c) Es la raiz cuadrada de la media de los cuadrados de las diferencias entre los valores reales y 
estimados, multiplicados por el coeficiente de correlacion. 

d) Es la raiz cuadrada de la media de los cuadrados de las diferencias entre los valores reales y 
estimados. 

87. En un analisis de dos variables, que significado e importancia tienen para usted los resultados 
correspondientes a: 

a) Varianza residual; b) Varianza explicada; c) Error estandar de estimacion d) Coeficiente de 
correlacion; e) Limites de confianza para el estimativo. 

88. Defina de la manera mas simple: 

a) Regresion b) Correlacion 

c) Nube de puntos d) Metodo de los minimos cuadrados 
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89. Dos ecuaciones de regresion, cuyas ecuaciones son: Y = 2,8 +10 y X= 0,3 + 20. ^Cual es el valor 

del coeficiente de correlacion lineal? 


90. La siguiente informacion corresponde: X = edad de maquina en anos y Y= gastos de mantenimiento 

durante los dos ultimos anos (en diez miles de $) Utilizando los datos de cuatro maquinas, los cuales 
fueron: Z =12; Z =24; Z . =78; Z 2 = 44. Calcular: 

i 7 i 7 i i 7 i 

a) El valor de c b) Y = b + c c) Y para = 6 

91. Dadas las siguientes variables X = gastos de mantenimiento del local (cientos de $) y Y = miles 
de articulos vendidos en un dia por almacen. 

2 = 194 £ 2 = 323.200 “= 9.360 S 2 = 7.694 r = 0,9 n = 20 

i i 7 

a) Estime el modelo de regresion lineal para Y e interprete el valor de b ( ft ) 

b) ^Cuantos articulos se venderan en un dia si se gastan $940,000 en mantenimiento? 


92. Observe la grafica y responda los siguientes puntos: 

1. En este problema especifico, el investigador intenta pronosticar: 

a) La cantidad solicitada (demandada) con base en el precio 

b) El precio con base a la cantidad solicitada 

c) Tanto el precio como la cantidad solicitada 

d) Ninguna de las opciones es correcta 

2. Cualquier pronostico con base en estas nociones serian: 

a) De ninguna o poca utilidad 

b) Con un error tan grande que no satisface 

c) Sin error 

d) Ninguna de las opciones es correcta 



93. ^Cual es el coeficiente de correlacion entre dos variables si: 

a) ^Una de las variables es constante? 

b) i El valor de una de las variables excede en 50 unidades al de la otra variable? 

c) /,La variacion no explicada es el doble de la explicada? 


94. Suponga que al analizar la relacion entre 30 observaciones de dos variables, se encuentra que la 
suma de los cuadrados de las diferencias entre los valores de la variable Y y su media aritmetica es 
220; y que la suma de los cuadrados de las diferencias entre los valores estimados y su media es de 
38,4. La pendiente es positiva. 

a) iC ual es el coeficiente de determinacion? 

b) ^Que porcentaje de la variacion total ha sido explicada? 

c) /,Puede rechazarse la hipotesis de que no existe correlacion lineal a un nivel de significacion del 
5%? 

95. En una regresion de sobre basada en 20 observaciones, el valor del coeficiente de determinacion 
es 0,36. 
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a) /Jndica este resultado que existe una correlacion significativa entre y a un nivel de 
signification del 5% siendo la prueba bilateral? 

b) /,Cual es la proporcion de la variacion que queda sin explicar por esta recta de regresion? 

96. Se dispone de la siguiente informacion sobre dos variables relacionadas entre si, obtenidas mediante 
una muestra aleatoria de 50 observaciones. 

Resultados de algunas operaciones 

Ex,«, =374 Ex, 2 n t - 4.410 

Yx t y e n t = 9.288 Yy t n f = 800 

I.yfn, =19.736 n = 50 

Con la informacion anterior, se pide estimar Y cuando =30 fijando limites de confianza del 95% 

97. El personal tecnico operativo que solicita ingreso a una empresa manufacturera, es sometido a un 
proceso de evaluacion (conocimientos, experiencia, etc.), utilizando una escala de valoracion entre 
0 - 20; dos meses despues de su ingreso realiza un curso de capacitacion avanzada, calificada de 
0-5, tal como lo muestra la tabla adjunta de 14 funcionarios seleccionados al azar: 


EMPLEADO: 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

EVALUACION: 

12 

10 

13 

8 

7 

11 

11 

14 

12 

14 

9 

10 

10 

13 

CAPACITACION: 

3,9 

4,2 

4,2 

3,8 

3,8 

3,8 

4,3 

4,4 

4,5 

4,4 

3,9 

3,7 

4,3 

3,6 


Determinar la relacion existente entre la evaluacion y las calificaciones que recibieron en la 
capacitacion. ^Cual es el coeficiente de correlacion de rangos? (Metodo de Spearman) 


98. Una firma comercial tiene actualmente 180 puntos de ventas, con deseos de ampliar su cobertura a 300 
puntos en total. Para decidir, desarrolla una encuesta a 15 de los puntos de ventas seleccionados al azar. 
Entre las 20 caracteristicas investigadas, se encuentran: ventas diarias (mill $); mts 2 de area; Numero de 
vehiculos que pueden parquear, informacion que se presenta a continuacion. 




Operaciones realizadas: 

Zx, = 2.446 Zx 2 = 1.096 Zx 3 = 303 n = 15 

Ex, 2 = 401.778 Ex 2 2 = 81.408 Ex 2 = 6.507 

Yx f x 2 = 179.293 Yx 2 x 3 = 22.406 Hx 1 x 3 = 49.761 

Con la informacion anterior, aplicando simbologia y procedimientos por usted seleccionados, se 
pide: 

a) Estimar el espacio requerido, si consideramos ventas diarias de $180 millones de pesos y un 
numero promedio de 25 vehiculos estacionados. 
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b) Calcular el coeficiente de correlacion total o multiple. 

OPTATIVO: Con la anterior informacion, realizar la prueba al coeficiente de regresion, de la 3° 
variable, cuando se estima la 2° variable. 



El capitulo se dedica al analisis de regresion corre acidn. Son dos aspectos que se deben 
considerar cuando se trabaja simultaneamente con dos o mas ariab es. Con el primero 
se establece mediante un mode o matematico que nos permita representar el conjunto de 
observaciones a traves de una inea recta parabo ica e ponencia o de cualquier otro tipo. 
Una vez determinada la ecuacion, se podra estimar un valor o promedio de una de las variables 
en funcion de otra o mas variables y, mediante la corre acidn, tecnicas que nos van a permitir 
establecer la fuerza, la intensidad de relacion (correlacion) entre esas variables. 

La forma de visualizar mejor la informacion sobre la relacion que puede haber entre dos 
variables, se obtiene mediante la elaboracion de una grafica denominada “ nube de puntos “ o 
diagrama de dispersion solamente cuando se trabaja con dos variables en forma simultanea 

Dentro del desarrollo del tema, se calcula y explica una serie de medidas de gran importancia 
en el analisis de relacion, tales como coeficientes de regresion, arian a residua , arian a 
e p icada , error estandar de estimacion, obtencion de estimati os y limites de confianza. 
Finalmente la aplicacion de pruebas de significacion tanto para el coeficiente de regresion, 
como para el de correlacion. 








CONTENIDO 


Algunos 
Metodos 
de Muestreo 


Lo que hay que averiguar no 
son las respuestas correctas sino 
las preguntas correctas. 

Peter Drue er 


■ Aplicaciones, terminos, simbologia, 
definiciones, conceptos generales. 

■ Muestreo aleatorio y no aleatorio. 

■ Muestreo aleatorio simple. Tamano 
muestral. Estimaciones de promedios y 
totales. Limites de confianza. Error de 
muestreo. 

■ Muestreo estratificado. Asignacion 
igual, proporcional y optima. Tamano 
de la muestra. Estimativos. Limites de 
confianza. 

■ Muestreo Sistematico de Conglomerados, 
Bietapico, Multiple y Mixto. 

■ Sintesis de la Unidad. 

■ Ejercicios para Resolver, resueltos 

en el Sistema de Informacion en 
Linea SIL. 

COMPETENCIAS 

El estudiante debera estar en capacidad de: 

□ Entender y manejar correctamente cada 
uno de los terminos y simbolos que deberan 
ser utilizados en las investigaciones por 
muestreo. 

□ Conocer la importancia que tiene el 
muestreo no solo como asignatura, en la 
investigacion, sino tambien en el ejercicio 
profesional. 

□ Realizar pequenas y medianas investiga¬ 
ciones, aplicando los conocimientos re- 
cientemente adquiridos, en cada una de 
las etapas del proceso. 

□ Saber interpretar los resultados obtenidos 
en las investigaciones. 
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GENERALIDADES 


En la vida diaria nos encontramos con muchos ejemplos de aplicacion del muestreo: examenes de 
laboratorio ordenados por el medico; en la television y la radio, se dan resultados de encuestas de opinion; 
antes de comprar algun articulo comestible, se nos ofrece una pequena porcion para que decidamos su 
compra; en la casa reclamamos si esta frio o salado el alimento, solo con la prueba de una pequena porcion, 
por lo tanto no hay necesidad de probar la totalidad del producto para determinar el comportamiento de 
la caracteristica. 

Lo anteriormente expuesto y otros factores que veremos en el transcurso de esta unidad, hacen 
indispensable realizar una in estigacion parcia y no total para llegar a conocer el comportamiento de 
un grupo. 

Hemos mencionado la palabra muestra para describir una parte de la poblacion y muestreo son las 
tecnicas o herramientas utilizadas para la realizacion de una muestra. En la aplicacion de estas tecnicas 
es necesario conocer y manejar algunos terminos indispensables en el desarrollo de una investigacion, 
tal como se expondran a continuacion. 

POBLACION O UNIVERSO 

Es un conjunto de unidades o e ementos ue presentan una caracteristica com n; tambien se le considera 
como un conjunto de medidas. Si la caracteristica observada ha sido medida, recibe el nombre de variable 
continua; si, por el contrario, tan solo se hace el recuento se le denomina atributo o puede ser una variable 
discreta. 

Considerar la poblacion como conjunto de unidades o elementos, debe entenderse como un grupo 
de personas, familias, establecimientos, manzanas, barrios, objetos, etc., pero en realidad es un conjunto 
de medidas obtenidas de las caracteristicas estudiadas. Por ejemplo, al considerar un grupo de personas 
de acuerdo a la finalidad de la investigacion, se podra estudiar su nivel educativo, sexo, ocupacion, edad, 
preferencias, habitos o cualquiera otra caracteristica. Para un conjunto de personas que presentan las 
mismas caracteristicas, se buscara information cuantificada, algunas veces mediante el recuento de uni¬ 
dades. En este caso particular, numero de personas con determinado nivel educativo; numero de hombres 
y/o mujeres; cuantas de ellas se encuentran trabajando, etc.; en otros casos la caracteristica sera medida 
(estatura, peso, ingresos, etc.). 

No es correcto, entonces, considerar la pob acion o uni erso como si forzosamente estuviese cons- 
tituida por la totalidad de habitantes de una zona geografica o por un grupo mas pequeno, para investigar 
caracteristicas tales como estado civil, sexo, ocupacion, position economica, siempre y cuando se trate 
de seres humanos; se puede conformar otro tipo de poblacion o universo diferente a personas, como 
establecimientos comerciales, industriales, servicios publicos, ubicados dentro de la zona o cobertura 
geografica que se desea estudiar. Se pueden constituir poblaciones de animales, objetos, articulos produ- 
cidos por una fabrica, etc. 

UNIDAD Y ELEMENTO 

La unidad es divisible, por ejemplo una familia se puede subdividir en personas que la conforman; una 
universidad se divide en facultades, a su vez puede considerarse como unidad, ya que se subdivide en 
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cursos y estos en estudiantes. En cambio el e emento es indivisible, una persona, una cosa, etc, sigue 
siendo la forma mas elemental de presentation, sin embargo, generalmente se habla en forma indistinta 
de elemento o unidad como una sola cosa. 

La Unidad hace referencia a una persona, una familia, una vivienda, una manzana, un barrio, un 
establecimiento, una tarjeta o ficha academica, etc., y se denomina unidad e ementa o e emento cuan- 
do con ella obtenemos la informacion necesaria. Es el individuo, entidad u objeto, del cual deseamos 
observar todas o algunas de sus caracteristicas para ser medidas o contadas. La unidad o elemento debe 
ser c ara , es decir de facil identificacion por todos los que intervengan en el proceso de la investigacion; 
debe ser adecuada al objeto de la investigacion, ademas, mensurab e y comparab e. 


En la encuesta sobre la industria manufacturera, se define la unidad elemental estadistica o 
de enumeracion, como a ue a unidad economica bajo un propietario o contro nico ue se 
dedica e c usi a o principa mente a una c ase de acti idad industria en una ubicacion nica. 

En la encuesta de hogares, la unidad de seleccion final es la vivienda, en tanto que la unidad 
de observacion esta constituida por el hogar o grupos familiares que habitan en las unidades 
de vivienda, seleccionadas en la encuesta. En los hogares se establece distincion entre las 
diferentes unidades de consumo existentes, clasificando las familias Qnprincipa es , secundarias 
y miembros sup ementarios. 

Una unidad o e emento de consumo podria ser una persona que vive sola, que atiende sus 
propios gastos de mantenimiento y que no depende economicamente de otra o de grupo 
familiar, o bien, varias personas que viven bajo el mismo techo relacionadas por factores 
monetarios, es decir, que aportan sus ingresos a un fondo comun, que sirve para los gastos de 
la familia y para el consumo personal de cada uno de los miembros. La fami ia principa se 
compone en el caso mas simple, por el jefe del hogar, su conyuge y todos los hijos solteros que 
no reciben ingresos o, si reciben, realizan sus gastos del fondo familiar comun. 

La fami ia secundaria esta compuesta por personas que no forman parte de la principal, pero 
comparten entre si los gastos de alimentacion. Habra, por lo tanto, tantas familias secundarias 
como grupos adicionales de personas que compartan los gastos de alimentacion entre si. 

Se considera tambien como miembros sup ementarios a las personas que comparten, al menos, 
los gastos de alimentos con una de las familias (principal o secundaria) aunque no comparten 
otro tipo de gastos o ingresos. 


En conclusion, la unidad o unidades asi como el elemento a considerar en la investigacion deben ser 
bien definidas , adecuadas, mensurab es y comparab es. 

Unidades de Seleccion: son los diferentes grupos o subgrupos que pueden formarse de la pobla- 
cion total o universo. Deben distinguirse las unidades parciales y finales de seleccion, las unidades de 
observacion y las unidades o elementos de analisis. 

Unidades Parciales de Seleccion: son aquellas que se obtienen, como consecuencia del proceso de 
seleccion de las unidades que conformaran la muestra, constituyendose en subdivisiones de la poblacion 
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a traves de la cual se llega a la unidad final de seleccion. Ejemplo, una ciudad para efectos de una inves¬ 
tigation puede ser dividida en zonas o barrios. Estos, a su vez, pueden subdividirse en manzanas y estas 
ultimas, en viviendas. La unidad final puede ser la familia, pero en cada una de las subdivisiones se debe 
efectuar una seleccion, generalmente aleatoria. 

Unidad final de seleccion: tiene caracteristicas definidas de permanencia y puede ser identificada 
con facilidad en el transcurrir del tiempo. En el ejemplo anterior la unidad final de selection puede ser 
la familia, la vivienda, etc. 

Unidades de observation: son aquellas que, en conjunto, conforman la poblacion o universo, dada 
una caracteristica comun. 

Unidad de analisis: son aquellos elementos o unidades sobre las cuales se concentra el estudio, 
quienes suministran la informacion que luego va a ser analizada a fin de obtener conclusiones. 

En la mayoria de los casos se trabaja con unidades de observacion, como sucede en el muestreo 
a eatorio simp e. Sin embargo hay casos, como en la encuesta de hogares, donde se consideran varias 
etapas de seleccion {muestreo mu tietapico ), que implica unidades de seleccion, tales como: 


a. Selection de barrios. 

b. Seleccion de manzanas. 

c. Seleccion de viviendas. 

d. Seleccion de familias. 

e. La unidad de observacion puede ser el jefe del hogar de quien debe obtenerse la 
information. 

f. La unidad de analisis podria ser la persona, si el objeto de la investigacion es por ejemplo 
el ingreso per-capita. 


POBLACION FINITA E INFINITA 

Dependiendo del numero de unidades o e ementos de obser acion , la poblacion puede ser conside- 
rada como finita o infinita. 

Poblacion infinita , conformada por un indeterminado numero de unidades, tal es el numero de 
peces en un rio o el numero de granos de arroz recolectados en una region. El comportamiento de una 
poblacion demasiado grande, aun siendo finita, tiende a ser considerada como una poblacion infinita al 
calcular el tamano de la muestra, por ejemplo, el numero de tachuelas producidas por las fabricas situa- 
das en los paises latinoamericanos. 

Al determinar el tama o de a muestra , en una poblacion finita pero demasiado grande, el resultado 
no varia sustancialmente al establecido para la poblacion infinita. 

La poblacion finita es aquella constituida por un determinado o limitado numero de elementos o 
unidades y en la mayoria de los casos, considerada como relativamente pequena. 
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CARACTERISTICAS 

Lo investigado en una unidad o elemento son sus caracteristicas, las cuales se clasifican en cua ita- 
ti as y cuantitati as. 

Caracteristicas Cualitativas: son atributos, susceptibles de ser expresados mediante palabras, 
(ocupacion, profesion, actividad economica, nacionalidad, marcas, puertos de embarque, sexo, estado 
civil, propietario de vivienda, etc.). Solo se pueden contar, no son mensurables. 

Caracteristicas Cuantitativas: son ariab es que se expresan numericamente (ingresos, ventas, 
consumos, edades, estaturas, etc.). 

Ejemplos de algunas unidades cuyas caracteristicas (cualitativas y cuantitativas) pueden ser estu- 
diadas, acorde con la unidad objeto de investigacion: 


UNIDAD 

CARACTERf STICAS A ESTUDIAR 


Numero de personas que la componen 

Niveles de escolaridad 

T7 qrrnl i ^ 

Numero de personas que trabajan 

Ingresos y gastos 

r diiiiiid 

Ocupacion 

Propiedad de la vivienda 


Numero de personas que estudian 

Datos generales de la vivienda 


Produccion bruta 

Horas de produccion 

Establecimiento industrial 

Empleo 

Consumo de energia 


Sueldos y salarios 

Actividad economica 


Edad 

Clase de consulta 

Hospital 

Sexo 

Numero de hospitalizaciones 

Pacientes segun 

Estado civil 

Clase de tratamiento 


Residencia 

Ocupacion 


Las caracteristicas se describen mediante utilizacion de promedios, proporciones, ra ones etc. Ta¬ 
les medidas reciben el nombre de parametros, cuando son aplicadas a las caracteristicas de las unidades 
en la poblacion y estimadores en la muestra. Son resultados de estas mediciones el promedio de duracion 
de hospitalizacion, el porcentaje de mujeres atendidas por maternidad, la relacion mujeres/hombres, etc. 

INVESTIGACION TOTAL Y PARCIAL 

Dependiendo del objetivo u objetivos que se persigan, puede realizarse una in estigacion e hausti- 
a o una in estigacion parcia 

Exhaustiva: En este caso, se deben observar todas las unidades que constituyen la poblacion o 
universo, objeto de la investigacion. La enumeracion total de una poblacion en un tiempo dado, recibe el 
nombre de censo (censos de poblacion, de la industria manufacturera, del sector agropecuario, etc.). El 
censo requiere de una organizacion enorme y la ocupacion de un gran numero de personas en cada una 
de las diferentes etapas de la investigacion. 
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Algunos factores negativos del censo son: 

□ Demasiado tiempo requerido para realizarlo, lo cual impide obtener informacion antes de 
que se tome obsoleta. 

□ El costo , tanto durante la etapa de planeamiento, como en la de recoleccion, sistematizacion 
y publicacion es bastante elevado, lo que impide que se realice con mayor frecuencia. 

□ Es muy frecuente que se presente el error sistematico , como consecuencia del volumen 
de unidades numeradas y la cantidad de caracteristicas investigadas; el error aumenta a 
medida que se van efectuando las diferentes operaciones requeridas por el censo. 

Un censo no puede realizarse cuando el elemento investigado se destru e. (control de calidad 
de un producto). Por ejemplo, al tratar de investigar la duracion del total de las bombillas pro- 
ducidas por una fabrica, se tendria como resultado la inexistencia de unidades para la venta, 
por la destmccion misma del elemento. 

En algunos casos no podra obtener informacion especializada; por ejemplo, someter a todos los 
habitantes del pais a un examen medico, cuando se quieren elaborar estadisticas sobre salud. 


Sin embargo, el censo es necesario, cuando se necesiten datos locales para cada subdivision geografica 
del pais y se desee una cobertura del 100%. 

En resumen, un censo no se podra realizar, cuando: 

□ La poblacion sea infinita. 

□ Aun siendo finita, sea demasiado numerosa. 

□ El tiempo sea mayor al requerido. 

□ El costo de la investigacion es superior a los recursos disponibles. 

□ La observacion implica destmccion de los elementos (resistencia de materiales). 

□ La caracteristica es homogenea, tal como en la prueba de alimentos, examenes de sangre, 
orina; etc. 

Las anteriores consideraciones, obligan a buscar un metodo mas practico para obtener informacion, 
en especial para poblaciones grandes. Este metodo consiste en realizar un estudio parcia de la poblacion 
denominada muestra y tiene las ventajas de: 


□ Reducir costos y tiempo. 

□ Ser aplicable en poblaciones infinitas o muy grandes. 

□ Servir como forma practica para no destmir la totalidad de los elementos de la poblacion. 
Sin embargo, la decision entre censo y muestra depende, en la mayoria de los casos, de la 
finalidad del estudio. 


Muestra o Investigacion Parcial: se define como un conjunto de medidas pertenecientes a una 
parte de la poblacion. 
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Tambien se considera una parte de la poblacion o subconjunto de elementos, que resultan de la apli- 
cacion de algun proceso, generalmente de seleccion aleatoria, con el objeto de investigar todas o parte de 
las caracteristicas de estos elementos. 


La seleccion de las unidades debe ser a eatoria , lo que equivale a decir probabilistica, con el 
fin de obtener una muestra representativa de la poblacion, respecto de todas o algunas de sus 
caracteristicas, para las cuales el valor del parametro es desconocido. En caso contrario se 
habla de una muestra no a eatoria. 


MUESTREO NO ALEATORIO 


Una muestra no es a eatoria cuando los elementos son elegidos por medio de metodos no aleatorios. 
Este procedimiento esta sujeto a errores, ya que se confia al juicio subjetivo de seres humanos, como en 
el caso de seleccion dirigida (no aleatoria), donde las unidades son tomadas en forma caprichosa y en la 
mayoria de las veces por conveniencia; tal sucede en las encuestas de opinion que realizan los locutores 
deportivos, cuando se juega un partido de futbol o en las entrevistas para television, radio o prensa, 
hechas en las principales vias de la ciudad, con el animo de conocer la opinion sobre algun asunto de 
interes para la comunidad. 

La muestra dirigida esta constituida por una parte de la poblacion, que el investigador considera 
representativa del universo, como en el caso de seleccionar diez (10) familias ubicadas en un barrio de 
la ciudad, para que opinen sobre la seguridad o medidas de vigilancia en la zona. Tambien pudo haberse 
hecho un llamado a las familias del barrio, para que se presenten voluntariamente a dar su opinion; en 
este caso el proceso se denomina muestreo de o untarios. 

Si la caracteristica es homogenea, la representatividad de la muestra puede ser satisfactoria; por 
ejemplo en un restaurante, una cucharada de sopa o un sorbo de vino; en un almacen, un trozo de tela o 
un par de zapatos, son representativos del total de sopa preparada, del vino para la venta o de la tela o 
calzado que dispone el establecimiento. Si se desea practicar examen de sangre a un paciente, el resulta- 
do sera el mismo aunque la muestra varie de 1 cm 3 a un litro. 


Hay otros metodos de muestreo no aleatorio como: el opinatico la unidad se selecciona en 
opinion del investigador; el intenciona , hay intencion al seleccionar; por cuotas, en este caso 
se le dice al entrevistador cuantos hombres, mujeres, cuantos casados, solteros se deben entre- 
vistar, es decir, se le fijan cuotas: de todas maneras es un muestreo sin validez, por esa razon 
se le llama muestreo erratico , generalmente conduce a errores. 


MUESTREO ALEATORIO 


Una muestra es a eatoria cuando los elementos que constituyen la poblacion o universo investigado, 
tienen la misma posibilidad de ser seleccionados. 

Existen numerosos procedimientos en la aplicacion del muestreo a eatorio. Los mas importantes son: 

1. Muestreo Aleatorio Simple: con reposicion de las unidades, corresponde a una distribucion bino- 
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mia ; sin reposicion, a una distribution hipergeometrica. Tambien se le conoce como muestreo irrestricto 

El metodo de muestreo a eatorio simp e es recomendable, en especial, cuando la poblacion no es 
numerosa y las unidades se concentran en un area pequena; por otra parte, la caracteristica no debe tener 
gran variabilidad, porque implicaria un tamano muestral muy amplio lo que, a su vez, incremental 
costos y tiempo; por ultimo, la poblacion debe facilitar su enumeracion para que permita la aplicacion 
de este metodo. 

□ Se requiere un listado de unidades de la poblacion, lo cual no es facil, en muchos casos 
(marco). 

□ Si el area es amplia, es probable que haya necesidad de traslado a lugares lejanos, para 
investigar unas pocas unidades, dificultando su aplicacion (costo y tiempo). 

□ No existe garantia de que todas las unidades queden representadas en la muestra, cuando 
la caracteristica tiene una gran variabilidad. 

□ Si el coeficiente de variacion es mayor del 30%, el tamano de la muestra se va haciendo 
mas grande. 

Las anteriores observaciones conllevan a fijar tres inconvenientes que presenta el metodo de mues¬ 
treo a eatorio simp e. 

2. Muestreo Aleatorio Estratificado: se le denomina tambien como muestreo a eatorio restringido 
Este procedimiento implica una division de la poblacion en grupos, denominados estratos en tal forma que 
el elemento presenta una caracteristica tan definida que solo le permite pertenecer a un unico estrato. Por lo 
tanto, para que la division por grupos sea efectiva, los factores de estratificacion deberan guardar estrecha 
relacion con las caracteristicas que se investigan y con el objetivo o finalidad del estudio. De esta manera se 
logra una mayor precision en los resultados. Supongamos que se desea hacer una investigacion sobre trans- 
porte urbano en una determinada ciudad, con el fin de establecer los costos de operacion por pasajero. En 
este caso, una muestra aleatoria simple de 300 vehiculos no nos da garantias de que los diferentes tipos de 
vehiculos, buses, busetas, micros y colectivos queden bien representados en la muestra, si se tiene en cuenta 
que pueden haber grandes diferencias, no solo en cuanto a capacidad del vehiculo, sino en su recorrido. 
En este caso, es preferible establecer estratos o grupos mediante la clasificacion segun el tipo de vehiculo. 

En el muestreo aleatorio estratificado , como en el muestreo a eatorio simp e , se requiere una lista 
detallada de las unidades que constituyen la poblacion a fin de elaborar los estratos o subpoblaciones, 
pero a pesar de lo dispendioso que puede resultar este procedimiento, hay garantia de que los elementos 
de la poblacion queden bien representadas en la muestra. 

Este metodo es mas eficiente que el muestreo a eatorio simp e , pese al grado de heterogeneidad y 
dispersion que puede presentar la caracteristica, con la ventaja de que al formar grupos mas o menos 
homogeneos, la muestra resultante es mas pequena y representativa. 

Mediante la seleccion aleatoria de los elementos, en cada uno de los estratos, se conformara la 
muestra. Dependiendo de la distribucion o escogencia de los tamanos muestrales para cada estrato, podra 
aplicarse alguno de estos tres procedimientos: 


□ Afijacion Igual o Asignacion Igual: se da cuando los elementos quedan asignados o 
repartidos por igual en cada estrato muestral. 
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□ Afijacion Proporcional o Asignacion Proporcional: los elementos se distribuyen en los 
estratos muestrales, en la misma proporcion en que se distribuyen los elementos en la 
poblacion. 

□ Afijacion Optima: cuando el tamano, tanto de la muestra general como para cada uno 
de los estratos muestrales, depende del grado de variabilidad de la caracteristica en cada 
estrato y del costo minimo para una precision dada. 


Se debe tener en cuenta que: si el coeficiente de variation ( S _ )100 es menor o igual al 30%, debe 
realizarse el muestreo a eatorio simp e\ si por el contrario es mayor a dicho valor, es decir el tamano de 
la muestra crece nos veremos obligados a aplicar el muestreo aleatorio estratificado, con el cual dismi- 
nuiremos tiempo, costos y ademas, logramos una mayor precision en la estimacion. 

3. Muestreo sistematico: mas que un metodo de muestreo, es considerado como un metodo de 
seleccion, al que algunos denominan metodos de se eccion a inter a os regu ares. Se aplica cuando la 
caracteristica a investigar se encuentra ordenada de acuerdo al valor, tiempo, cantidad, etc. 

Practicamente sobre los tres metodos anteriores, {muestreo a eatorio simp e , muestreo a eatorio 
estratificado y muestreo sistematico) se basa este capitulo, sin embargo es necesario que el lector sepa 
que existen otros metodos, no estudiados con amplitud, dado lo extenso para ser presentados. 

4 Muestreo Doble: denominado tambien bifasico porque se efectua en dos fases. Es aplicado de 
preferencia, cuando no existe informacion auxiliar que permita conocer los tamanos poblacionales de 
los estratos, ni la identificacion de las unidades; en este caso, primero se realiza una muestra aleatoria 
simple, generalmente grande, en forma rapida y sencilla para conocer en forma muy general algunas de 
las caracteristicas objeto del estudio; luego se procede a una segunda muestra extraida de la anterior, la 
que podria considerarse como submuestra con la cual se hacen las estimaciones. Si se utilizan mas de dos 
fases, se habla de muestreo m tip e o po ifasico. 

5 Muestreo por conglomerados Areas o Etapas: en los metodos anteriormente expuestos es 
necesario contar con un listado de unidades finales o unidades elementales de la poblacion. El muestreo 
por cong omerados se utiliza cuando no existe listado, o bien las unidades estan demasiado dispersas y 
no permiten llegar directamente a las fuentes de informacion. 

Esto nos obliga a sustituir las unidades fisicas o elementales, por grupos de unidades, que llamare- 
mos cong omerados ; generalmente son superficies o areas en las que se ha dividido el espacio ocupado 
por la poblacion. Supongamos que se desea realizar estudios a familias en una ciudad. Cada unidad o 
familia se constituye en un conglomerado, por tal razon se aplica el muestreo a eatorio monoetapico, es 
decir, se realiza la investigacion en una sola etapa. 

Si iniciamos con una seleccion de manzanas y de cada una de estas manzanas, se selecciona otra 
muestra correspondiente a familias, el metodo sera bietapico. Observese que hay una modificacion con 
respecto al anterior metodo, ya que los elementos no forman parte de los conglomerados, sino que son 
una muestra o sub-muestra de cada uno de ellos. 

Si hacemos una seleccion de barrios, luego de manzanas y por ultimo de familias, el metodo sera 
trietapico. E muestreo po ietapico o mu tietapico es una generalizacion y consta de mas de tres etapas. 
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Los cong omerados son unidades que contienen unidades o elementos, es de anotar, que en la apli- 
cacion del muestreo por etapas la unidad cambia en cada una de ellas, por lo tanto se requiere de varios 
marcos o listados, ya que se tienen varias poblaciones. 

6. Sub-muestras Interpenetrantes: en este metodo las submuestras, cada una con un numero de 
unidades, son seleccionadas aleatoriamente de la poblacion. Este metodo es utilizado en general para 
medir la concordancia entre los resultados obtenidos de muestras sucesivas. 

7. Metodos Mixtos: son el resultado de la combinacion de algunos o de todos los metodos anterior- 
mente mencionados. 

MARCO 

En la seleccion de unidades se requiere de un listado, que en algunos casos debe prepararse, en 
otros, se actualiza. Este listado debe corresponder al total de unidades o elementos que integran la po¬ 
blacion a investigar o a seleccionar que, a su vez, constituyen el marco de referenda o marco muestra 
correspondiente a la poblacion objetivo. Por ejemplo, la nomina de pago, ya sea para un grupo de traba- 
jadores en una fabrica o de empleados en una empresa, podria ser el marco; otro ejemplo podria ser el 
listado de matricula de los estudiantes en una universidad. 

Sin embargo, el marco no siempre estara representado por un listado, podra ser tambien un mapa o 
fotografias aereas. En el marco no deben aparecer unidades falsas; ejemplo: en el listado de matriculas 
no pueden figurar aquellos estudiantes que se han retirado por diferentes causas, pero que se alcanzaron 
a matricular. 


En el muestreo por etapas m tip es , debe existir un marco para cada etapa. El marco en cada 
etapa, debe ser lo suficientemente detallado en cuanto a la identificacion de sus unidades, de 
tal manera que si una de ellas es incluida en la muestra, pueda ser ubicada e investigada rapi- 
damente, sin que ello implique especificar la informacion que debe suministrar cada unidad. 


Rara vez los marcos son perfectos y lo comun es que sean inexactos, inadecuadamente descritos, 
desactualizados o con unidades duplicadas; por tal motivo, deben ser revisados y actualizados de manera 
que permitan una fiabilidad razonable por cuanto la muestra se basa en ellos. 

FALSEAMIENTO DEL ESQUEMA DE SELECCION 

El buen resultado de una investigacion por muestreo, no obedece solamente al empleo de un acer- 
tado metodo (la fijacion del tamano, el metodo de seleccion y la estimacion), sino que se requieren otras 
etapas en la investigacion, complementarias al buen exito del trabajo; algunas de ellas son: la e abora- 
cion de formu ario, instrucciones, entrenamiento de persona entre istador y la necesidad de una buena 
dosis de coordinacion en el trabajo de campo. 

Por ejemplo, el entrevistador juega un papel muy importante en la recoleccion de informacion y 
en el resultado final. De alii la necesidad de hacer comprender al personal, ciertos conceptos basicos 
de muestreo para que no se introduzcan vicios. Dentro de estos conceptos son de gran importancia la 
claridad sobre la unidad de observacion; valga la pena mencionar la encuesta de hogares, donde se debe 
conocer el segmento (unidad de muestreo) por medio de mapas o croquis; el entrevistador debe saber 
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determinar las viviendas que son seleccionables, (unidades de enumeracion) y en cada vivienda selec- 
cionada debe saber determinar a que personas va a pedir informacion (unidades de observacion). Debe 
existir una estrecha comunicacion y coordinacion entre el persona tecnico y el persona de campo o 
recolectores. Fallas que se producen durante el trabajo de campo, como la localizacion y la entre vista de 
las unidades seleccionadas, ocasionan fa seamiento en e es uema de se eccion. Veamos una de las tantas 
fallas que pueden ocurrir en el trabajo de campo y que se refieren a casos de unidades no entrevistadas, 
que algunos las clasifican en categorias, cada una de las cuales produce un efecto negativo en los resul- 
tados de la encuesta y requieren de una accion para ser corregida. 


□ El informante se rehusa a ser entrevistado quizas porque considera que la encuesta no tiene 
importancia, sospecha que el entrevistador sea un farsante, motivos politicos o religiosos, 
alega estar muy ocupado o estar cansado de participar en innumerables investigaciones 
que hacen tanto entidades publicas como privadas. Muchos de estos pretextos pueden 
eliminarse mediante la publicidad, carnet de identificacion, acordando la hora de 
entrevista a conveniencia del informante y en especial, motivando al entrevistado sobre la 
importancia de la investigacion. 

□ El informante no puede ser entre istado , tal es el caso de que no este, el establecimiento 
o la vivienda se encuentren cerrados en el momento de hacer la entrevista, incapacidad 
fisica o mental del informante, etc. Algunos inconvenientes pueden eliminarse mediante 
nueva visita. 

□ El informante no debe ser entre istado. El establecimiento fue cerrado defmitivamente por 
liquidacion, la direccion de la unidad se incluyo erroneamente en el marco de la muestra, 
la casa esta ocupada por personas que no son elegibles, solo hay un lote o la edificacion fue 
demolida, etc. Tambien puede suceder que la unidad localizada no corresponde al objeto 
de la investigacion. 


iQue se puede hacer, en especial, en estos ultimos casos? 

Algunos entrevistadores toman la decision de sustituir la unidad no encuestada, por la vecina, lo 
cual tiene como consecuencia una probabilidad de cero para la que debio ser investigada, mientras que 
la unidad vecina tendra una probabilidad mayor que las otras unidades. 

De acuerdo con lo anterior, se considera que en teoria, no debe existir sustitucion de unidades, para 
no falsear el esquema de seleccion; por tanto, a las unidades de las cuales se obtuvo informacion se les 
considera como dominio de estudio, ya que las no investigadas dejaran de pertenecer al grupo de nuestro 
interes. 

SUSTITUCION DE UNIDADES 

El concepto universalmente aceptado, es el de no sustituir la unidad que no haya informado; en la 
practica se acepta la aplicacion de algunos metodos de sustitucion , sin que sus resultados sean objetados. 
Algunos de ellos se presentan a continuacion: 


□ Se hace sustitucion , cuando en un segmento se encuentra, por ejemplo, una vivienda no 
entrevistada; en este caso, se toma la vivienda siguiente de acuerdo al orden de visita o de 
seleccion y la informacion obtenida se duplica. Este proceso se basa en el supuesto de que, 
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dentro de un mismo segmento, las familias que ocupan viviendas contiguas tienen una alta 
probabilidad de poseer caracteristicas economicas o sociales similares. 

□ Otro metodo de sustitucion, consiste en determinar el numero de unidades no entrevistadas, 
ya sea en la muestra, en el segmento, estrato, etc., luego se selecciona una muestra aleatoria 
dentro de las que han sido encuestadas, equivalente al numero de las que no respondieron 
y se duplica la informacion. 

□ El mas comun, consiste en tomar una muestra mayor a la establecida, mediante formula, 
conocida como tamano optimo. El numero mayor depende del conocimiento que se tenga 
sobre las unidades que no tendran informacion. 

□ Seleccionar al azar un numero igual a las unidades que no informaron, de la poblacion que 
no fue seleccionada en la muestra. 


A pesar de los esfuerzos para reducir la proporcion de casos no entrevistados, siempre quedara un 
residuo en todas las encuestas. En este residuo, deben preocupamos aquellas unidades que debieron haber- 
se entrevistado, tales como: nadie en casa, negativas, etc.; por tal razon se deben establecer medidas para 
reducir la resistencia a conceder las entrevistas. Los avisos en la prensa, radio y television, son ayudas para 
hacer consciente al publico de la importancia de la investigacion, tambien es usual el envio de cartas de 
introduccion, con anticipacion a la visita del entrevistador; otro metodo, a traves de los mismos entrevista- 
dores, consiste en distribuir material ilustrativo sobre la encuesta, antes de que la persona sea entrevistada. 

DOMINIO DE ESTUDIO 

Se dijo anteriormente que en el proceso de seleccion no debe haber sustitucion de unidades muestrales; si 
por algun motivo la unidad seleccionada no puede localizarse y no se sustituye, se va a tener un numero 
de elementos o unidades, (con informacion) inferior a la del tamano optimo. Si realizamos el analisis 
con estas unidades, corresponded al denominado dominio de estudio y los resultados no se consideran 
confiables por haber trabajado con un numero inferior al tamano optimo. Por ejemplo, inicialmente se 
establecio una muestra de 500 establecimientos, de los cuales, por diversas razones, 80 no respondieron. 
Debera considerarse a los 420 como tamano de la muestra en lugar de los 500 calculados. Las 80 unidades, 
disminuidas por quienes no informaron, son un subconjunto de la poblacion original que deberian ser 
tomadas en cuenta, con el fin de ser valida la estimacion realizada. 

Tambien se denomina como dominio de estudio , cuando se analiza parte de los elementos en la 
muestra que presentan algunas caracteristicas especiales; por ejemplo, se realiza una investigacion por 
muestreo en un barrio de la ciudad y entre las caracteristicas que se investigan esta el de ser propietario o 
no de vehiculo; pero luego, en el analisis de la informacion tan solo nos interesa estudiar el ingreso de las 
familias propietarias de vehiculo; en este caso se constituye una subpoblacion de familias con ingresos, 
las cuales, ademas requieren ser propietarias de vehiculo. 

METODOS DE SELECCION 

Existen diferentes metodos de seleccion al azar, tales como: 

Seleccion con reempla o: una vez determinado el tamano de la muestra, se debera establecer como 
se hara la se eccion de as unidades. Inicialmente la seleccion puede hacerse con o sin repeticion. En el 
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primer caso el elemento podra ser seleccionado mas de una vez, entonces se habla de una muestra a eatoria 
con reemp a o; en el segundo, el elemento seleccionado no podra ser tornado en cuenta nuevamente. 

El metodo de se eccion con reemp a o , es aplicado generalmente en el muestreo por conglomerados 
y en el submuestreo, siendo importante anotar que las diferencias en precision entre una seleccion con 
reemplazo y otra sin el, usualmente son de escasa importancia; de ahi que en el desarrollo de los dife- 
rentes metodos de muestreo que se estudiaran en esta unidad, se utilizara la seleccion sin repeticion, es 
decir, cada unidad solo podra seleccionarse una vez. 

Seleccion por sorteo: consiste en identificar, a cada una de las unidades de la poblacion mediante 
numeros consecutivos; se pueden utilizar tarjetas o balotas que lleven el numero; luego se introducen en 
un recipiente, se mezclan y se extraen de una en una, hasta completar el tamano de la muestra. 

Seleccion a intervalos regulares o sistematico: este metodo consiste en determinar un inter a o 
dividiendo el tamano poblacional por el tamano muestral. Dentro de este intervalo, establecido con las 
primeras unidades de la poblacion, se selecciona aleatoriamente una unidad, luego se le va sumando el 
valor del intervalo al numero resultante; por ejemplo: si el intervalo es de 10 y el numero seleccionado 
(entre 01 y 10) es 8, los siguientes numeros seran 18, 28, ..., etc. Este metodo se denomina se eccion 
sistematica. 

Uso de las tablas de numeros aleatorios: es comun la utilizacion de tablas que muestran conjun- 
tos de digitos agrupados, tanto en sentido vertical como horizontal, de acuerdo a una seleccion aleatoria 
con repeticion de una poblacion de 10 digitos (0 a 9), construida de tal manera que permita garantizar la 
aleatoriedad en la seleccion de las unidades. La manera como se elabora una tabla, en la forma mas ele¬ 
mental, consiste en numerar diez balotas, tarjetas o fichas de 0 a 9, se introducen en una urna y luego se 
sacan una a una, teniendo en cuenta que al extraer una, se lee, se anota el numero y se regresa a la urna, 
formando cifras de dos o mas digitos. 

Observemos la Tabla VI, que aparece al final del libro, su importancia esta en el uso; se podra leer 
en cualquier orden, en columnas hacia arriba o hacia abajo, en filas hacia la derecha o hacia la izquierda. 
Las cifras podran ser dos o mas digitos, dependiendo del tamano poblacional; por ejemplo, si la pobla¬ 
cion no es superior a 999 seran cifras entre 001 y 999. Si la poblacion es de 400 elementos, cualquier nu¬ 
mero aleatorio seleccionado que sea mayor a 400 no se tomara en cuenta, solo se seleccionaran aquellos 
numeros comprendidos entre 001 y 400. 

En resumen, para la utilizacion de las tablas se debe proceder asi: 

□ Se escoge al azar, una pagina cualquiera de las tablas. 

□ Se determina un punto de arranque al azar, es decir, sin mirar la pagina en el punto donde 
se coloque el dedo. 

□ La poblacion debera estar enumerada desde 1 hasta 9; desde 01 hasta 99; desde 001 hasta 
999 y asi sucesivamente, de acuerdo al tamano de la poblacion. 

□ Se sigue una misma direccion de seleccion, en columnas, filas, hacia arriba, abajo, a la 
derecha o izquierda. 

□ Se debe omitir aquel numero que no corresponda a la enumeracion de la poblacion y 
continuar hasta obtener los numeros deseados. 
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□ En casos especiales, cuando no se tenga una lista completa de las unidades, es preferible 
utilizar otras tecnicas de muestreo. 


USO DE LA CALCULADORA: 

la calculadora CASIO Fx 3.600P de bolsillo o cualquiera otra, permite la seleccion aleatoria. Su uso 
es sencillo, solo requiere oprimir primero la tecla INV | en otras | SHIFT | , luego la tecla 0 que aparece 
identificada como | RAN L apareciendo en pantalla por ejemplo la cifra 0.759. Este procedimiento 
no es aplicable en poblaciones mayores a 999, por lo tanto seran utilizados calculadoras que permiten 
obtener un mayor numero de digitos. Si se trata de poblaciones de dos digitos, se deben utilizar los dos 
ultimos o los dos primeros digitos que aparecen en pantalla. No se tiene en cuenta (para ningun caso) el 
0, que antecede al digito. 


I APLICACION DE EXCEL PARA SELECCION ALEATORIA 

A. PRIMER METODO DE SELECCION ALEATORIA PARA 50 DATOS. 

Trabajando con fx(funcion). 

□ En una hoja de calculo seleccionamos la opcion funcion fx, con el cual aparece un cuadro de 
dialogo correspondiente a INSERTAR FUNCION. 

□ Observemos dentro del cuadro de dialogo, el campo CATEGORIA DE LA FUNCION, en el 
cual seleccionamos la opcion MATEMATICAS Y TRIGONOMETRICAS y en el espacio 
correspondiente a SELECCIONAR FUNCION, senalamos la funcion ALEATORIO ENTRE. 



Figura No. 1. Insertar Funcion. 
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□ A1 hacer CLIC en ACEPTAR, nos aparecera la siguiente figura: 


Figura No. 2. Aleatorio entre (AB) 
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□ Para la seleccion de una muestra aleatoria, vamos a tener en cuenta la informacion que se 
presenta en la Tabla No. 1 (ver SIL). Si por ejemplo vamos a evaluar la estatura de 1.100 
estudiantes de un colegio, cuyos resultados se observan en la celda J, consideremos como el 
valor INFERIOR, la celda J3 y como el valor SUPERIOR, la celda J1102 que podria seguir 
nuestro numero aleatorio. Bajo este intervalo, esta formula nos arrojara un numero al azar 
entre estos valores. Es importante saber que los dos numeros tanto el maximo como el minimo 
pueden aparecer en el resultado. 


Figura No.3. Calculos Aleatorios Entre. 
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□ Dado que este resultado solamente arroja un numero aleatorio entre los 1.100 estudiantes, y 
queremos una muestra significativa de minirno 50 datos, seleccionamos la casilla donde se 
genero el resultado y desplegamos hasta conseguir un intervalo continuo de 50 datos, tal como 
se presenta en la figura siguiente: 


Figura No. 4. Resultados Muestra Aleatoria. 
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B. SEGUNDO METODO DE SELECCION ALEATORIA. 


Para efectos de realizar la seleccion aleatoria, nos ubicamos en la hoja electronica de calculo y 
procedemos de la siguiente manera: 

□ Hacemos CLIC en la ficha DATOS y seleccionamos la opcion ANALISIS DE DATOS. 


Figura No.5. Analisis de Datos 
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□ A1 presionar esta tecla aparece el siguiente cuadro de dialogo sobre el cual seleccionamos 
la opcion GENERACION DE NUMEROS ALEATORIOS tal como se presenta en la figura 
siguiente: 


Figura No.6. Insertar Funcion. 
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En el cuadro de dialogo que aparece, digitamos lo siguiente: 

□ NUMERO DE VARIABLES, si se requiere de todas las columnas o variables correspondientes 
a la informacion dada en la Tabla No. 1, las cuales son, por ejemplo 10, entonces el valor 
que debe colocarse en la primera casilla es 10, y la tabla de salida tendria el mismo numero 
de columnas correspondiente. Para este ejemplo tendremos en cuenta solamente una variable 
correspondiente a ESTATURA, por tanto digitaremos 1 en este campo. 

□ CANTIDAD DE NUMEROS ALEATORIOS, en este campo se digitara el numero aleatorio 
requerido, en nuestro caso sera 50. 

□ DISTRIBUCION, en esta celda se presentan varias opciones (uniforme, normal, Bernoulli, 
binomial Poisson, frecuencia relativa, y discreta) para nuestro ejemplo seleccionaremos la 
opcion UNIFORME. 

□ Una vez escogida la opcion UNIFORME debe aparecer un espacio que indica PARAMETROS, 
en esta casilla tenemos en cuenta los datos utilizados en el ejemplo anterior, solo que esta 
vez tecleamos el numero 140 y 164 correspondientes a los valores de la primera y ultima 
observacion. 


□ INICIAR CON; en esta se fija un numero cualquiera con el cual se inicia la seleccion. 

□ Finalmente en OPCIONES DE SALIDA activamos la opcion RANGO DE SALIDA y digitamos 
L3 que corresponde a la celda donde se presentaran los resultados. 
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Figura No.7. Generacion de Numeros Aleatorios. 
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Figura No.8. Resultado Generacion de Numeros Aleatorios. 


®| H > 



Insertar Diseno de pagina 


borrador845 - Microsoft Excel 

Formulas Datos Revisar Vista 


= ® S3 

O ° $ S3 


3 “ • a- a- ~ ~ 3 ® 


A-A- A « 


« • m B- m- 


- j^| Formato condicional ~ 

ooo m Dar formato comotabla ' 
iig) Estilos de celda - 


Insertar - 
H* Eliminar ” 


; £r 

Ordenar Buscary 


Portapapeles (i 

Fuente 


Pi Alineacion ri 

Numero ri 

Estilos 

Celdas 

Modificar 


N3 

- 

fx 140,26734214301 




V 


G 

H 

I 

J 

K 

L 

M 

N 

o 

p 

- 

1 

VNTES DE UN CENTRO EDUCATIVO) 




0 

2 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

Estatura Cm 

Peso/Kg 


Muestra 

aleatoria 

Estatura/Cm 





3 

1 

410 

18 

140 

46 



140,2673421 





4 

1 

360 

20 

158 

48 



140,8906522 





5 

2 

320 

21 

162 

50 



143,9661855 





6 

2 

2S0 

16 

166 

58 



152,2347484 





7 

2 

310 

17 

171 

64 



157,9478133 





8 

2 

290 

17 

146 

66 



148,2429273 





9 

2 

280 

18 

159 

61 



158,0899075 





10 

1 

250 

24 

162 

72 



141,2466201 





11 

2 

320 

20 

170 

70 



156,9992981 





12 

2 

240 

26 

172 

76 



144,1229286 





13 

1 

320 

20 

168 

65 



157,4541459 





14 

2 

330 

18 

174 

78 



163,8080996 





15 

2 

350 

16 

165 

65 



154,3368633 





16 

1 

300 

17 

170 

70 



152,0948515 





17 

2 

310 

19 

172 

76 



148,4443495 





18 

1 

300 

19 

166 

64 



149,5408185 





19 

1 

270 

21 

168 

60 



142,7598498 





20 

2 

260 

27 

165 

68 



140,75515 





21 

2 

290 

26 

171 

66 



156,2815027 





M 

4 ► M Hojal 

, Hoja2 Hoja3 

, O 



PI 4 


llll 

(V 



I AP 849-2 - Paint 7 0 A P lica en Excel Ar " 1 YouTube - [Full M... 


o: 40 Suma: 6015,530259 | go [D] 100% ©— 


<+) 


















































































































































































CAPfTULOTRECE 

ALGUNOS METODOS DE MUESTREO 


Nota: Cuando ya se hay an introducido los datos que deseamos estimar, se puede elegir entre 
diferentes opciones de salida segun las necesidades y el informe que se vaya a presentar. No obstante 
debemos agregarle las leyendas a cada una de las variables introducidas. 


C. TERCER METODO DE SELECCION ALEATORIA. 

□ Para el desarrollo de este nuevo metodo, nos ubicamos nuevamente en la hoja de calculo y 
realizamos las siguientes operaciones: 

□ Hacemos CLIC en la ficha DATOS y seleccionamos la opcion ANALISIS DE DATOS 


Figura No.9. Analisis de Datos. 


mi y *? - o* -1- 

Inicio Insertar Diseno de pagina 

m : ® konexiones 

[5* Propiedades 
& Editar vinculos 


it ms T 

Z J Ordenar Filtro 


borrador 845 - Microsoft Excel 

Formulas Datos Revisar Vista 

Borrar 

^ Volver a aplicai 

Avanzadas 
Ordenar yfiltrai 


□ [□PS3 


s a-i m ' 

B E- 

Agrupar - 

Desagrupar » "f 1 

Textoen Quitar 

columnas duplicados ” 

[H| Subtotal 

Herramientas de datos 

Esquema | 



N3 - Ji 140,26734214301 





V 

A B C 1 D E 

F 

G 

H 1 

J | K 

L - 


TABLA No. 1 POBLACION (1.100 ESTUDIANTES DE UN CENTRO EDUCATIVO) 


No. 

2 Orden 

Facultad 

Sexo 

No. 

Hermanos 

No. Libros 

Promedio 

calificacion 

matematicas 

Actualmente 

trabaja 

Calificaciones 

ICFES 

Edad/anos 

Estatura/Cm 

Peso/Kg 

3 

1 

2 

1 

3 

4 

2,6 

1 

410 

IS 

140 

46 

4 

2 

2 

2 

2 

2 

4,1 

1 

360 

20 

158 

48 

5 

3 

1 

2 

4 

6 

u 

2 

320 

21 

162 

50 

6 

4 

1 

2 

3 

2 

3,3 

2 

280 

16 

166 

58 

7 

5 

2 

1 

6 

10 

3,9 

2 

310 

17 

171 

64 

8 

6 

3 

2 

S 

6 

3,6 

2 

290 

17 

146 

66 

9 

7 

1 

1 

1 

2 

3,4 

2 

280 

18 

159 

61 

10 

S 

1 

1 

0 

0 

2,6 

1 

250 

24 

162 

72 

11 

9 

3 

2 

0 

6 

3,4 

2 

320 

20 

170 

70 

12 

10 

3 

2 

1 

3 

3,9 

2 

240 

26 

172 

76 

13 

11 

2 

1 

8 

5 

3,6 

1 

320 

20 

168 

65 

14 

12 

3 

1 

6 

3 

3,6 

2 

330 

18 

174 

78 

15 

13 

2 

2 

4 

3 

3,5 

2 

350 

16 

165 

65 

16 

14 

1 

1 

1 

4 

3,4 

1 

300 

17 

170 

70 

17 

15 

1 

1 

3 

3 

3.7 

2 

310 

19 

172 

76 

18 

16 

2 

1 

0 

4 

3,8 

1 

300 

19 

166 

64 

19 

17 

2 

1 

6 

2 

3,1 

1 

270 

21 

168 

60 

20 

18 

1 

2 

3 

6 

3,9 

2 

260 

27 

165 

68 

21 

19 

2 

2 

0 

2 

3,9 

2 

290 

26 

171 

66 


►i Hojal Hoja2 Hoja3 ;J 




Promedio: 150,3882565 Recuento:40 Suma: 6015,530259 11 SB! QBE 100% (3} 


^ AP 850 - Paint (jg Aplica en Excel Ar.,. '& YouTube - Seung... 


□ Esta vez nos trasladamos a la opcion MUESTRA, hacemos CLIC en ACEPTAR y aparece la 
siguiente figura: 
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□ Esta vez nos trasladamos a la opcion MUESTRA, hacemos CLIC en ACEPTAR y aparece la 
siguiente figura: 


Figura No. 10. Insertar Funcion. 
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Una vez elegida la funcion, se deben incluir los datos de la muestra como lo presenta el 
siguiente cuadro de dialogo. 


□ RANGO DE ENTRADA, es importante saber que este metodo solo admite un rango de entrada, 
que para el caso, sera el rango J2:J1102 correspondiente a la ESTATURA. 

□ Activamos la Opcion ROTULO. 

□ Escogemos el metodo ALEATORIO digitando, en la opcion NUMERO DE MUESTRAS, el 
valor de 50 que corresponde al valor de la muestra que estamos utilizando. 

□ Finalmente seleccionamos alguna de las OPCIONES DE SALIDA que nos presenta, en nuestro 
caso activamos la opcion RANGO DE SALIDA digitando la celda M3. 


Figura No.ll. Datos de Muestra. (Pantallazo adicional) 
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Figura No. 12. Resultados de la Muestra. (Pantallazo adicional) 
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Nota: una vez usted obtenga el rango de entrada, recuerde que por este metodo solo es posible 
tomar solamente un rango, para mayor manipulacion de la muestra debe ordenarlo en forma ascendente 
y luego ir a la tabla base donde estan los 1.080 elementos que constituyen la poblacion. En la segunda 
parte del CD que acompana al libro encontrara en conjunto toda la aplicacion del EXCEL a la estadistica, 
que al igual al capitulo 13, ofrece una base de datos para trabajar. 


OB JETO DEL MUESTREO ALEATORIO 

El objeto del muestreo a eatorio es seleccionar una parte representativa de la poblacion, con el fin de 
obtener estimadores de los parametros. Para lograrlo existen varios metodos y en cada uno de ellos se 
puede establecer: 

a. El grado de precision requerido en los estimadores. 

b. Tamano de la muestra. 

c. Costo y tiempo. 

Estimadores: el estimador es una medida que describe una determinada caracteristica de la mues¬ 
tra, obtenida mediante la aplicacion de promedios, proporciones, tasas, razones, varianzas, desviaciones 
tipicas, etc. 

Se les llama estimadores , ya que se les considera como el mejor valor que sustituye a los valores 
numericos poblacionales, generalmente desconocidos, a los que se llega por medio de datos proporcio- 
nados por la muestra, en tanto que un parametro describe una determinada caracteristica de las unidades 
en la poblacion. 
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Los estimati os obtenidos a traves de una muestra pueden considerarse como el comportamien- 
to de esa caracteristica en toda la poblacion. La estimacion de los parametros se hace a partir de los 
estadigrafos calculados en una muestra, con los cuales se obtienen conclusiones, que permiten, a la vez, 
la realizacion de pruebas de hipotesis, proceso denominado inferencia estadistica. 

Si para cada parametro desconocido se calcula una cifra unica, la estimacion se denomina puntua o 
estimacion de punto 

Si se establece un intervalo o rango de valores dentro de los cuales se espera encontrar el parametro, 
con cierto grado de confianza, se le denomina estimacion de intervalos. Los limites que definen el inter¬ 
valo se conocen como limites de confianza. 

Un buen estimador debe reunir cuatro condiciones o propiedades: 


□ Insesgado : se dice que un estimador es insesgado, si el valor esperado del mismo es igual 
al parametro de la poblacion que estima. 

□ Eficiente : se refiere a lo cerca que se encuentre el valor estimado del parametro. 

□ onsistente : se obtiene cuando el tamano de la muestra se incrementa en tal forma que la 
varianza disminuya, siendo menor la diferencia entre el valor real y el estimado. 

□ Suficiente : es un estimador que utiliza toda la informacion que posee una muestra sobre el 
parametro que se estima. 


Tamano de la muestra: una de las decisiones mas importantes que se debe tomar en una investi¬ 
gacion por muestreo, consiste en la determinacion del tama o optimo , simbolizado por n. Se dice que 
una muestra debe ser pequena, con el fin de que el costo de la investigacion sea lo suficientemente bajo, 
y bastante grande para que el error del muestreo sea admisible. Algunos creen que el tamano de la mues¬ 
tra crece indefinidamente a medida que aumenta el tamano poblacional, simbolizado por N, pero no es 
cierto, ya que existe un punto en el cual el tamano de la muestra permanece constante, asi el tamano 
poblacional aumente. 

En el calculo del tama o optimo , se deben tener en cuenta, los siguientes componentes: 

E Error de Muestreo: es la diferencia que puede haber entre el valor poblacional (parametro) y la 
estimacion de la misma (estimacion puntual o estadigrafo), obtenida por medio de una muestra aleatoria, 
observada en una de las tantas muestras posibles de una poblacion dada. La totalidad de estos errores, 
genera la distribucion de muestreo empleada para estimar el valor poblacional. 


- = media muestral 
p = media poblacional 
E = error de muestreo 


± E = p 
p= “ ± E 


En muchos casos, el error sera determinado por el investigador; por ejemplo, si en un sector de la 
economia se requiere estimar el promedio de salarios, y se sabe por observaciones aisladas o por expe- 
riencia, que el ingreso promedio para ese sector es aproximadamente, de $780,000, el error respecto al 
parametro podria ser: $780,000 ± E. De acuerdo con la finalidad de la investigacion podria considerarse, 
para este caso, que un error de ± $60,000 o cualquier otro valor es mas que suficiente, dado el grado de 
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variabilidad que supuestamente tengan los salarios en dicho sector. Sin embargo, este procedimiento re- 
quiere, ademas de cierta experiencia, un conocimiento previo sobre el comportamiento de la caracteristi- 
ca en la poblacion que se estudia, de ahi que es mucho mas practico determinar el error como porcentaje, 
en la mayoria de los casos no mayor del 10%, aplicado a la media aritmetica, generalmente obtenida en 
una encuesta preliminar: 

E = (%)C) 


El porcentaje podria considerarse en algunos casos como un complemento del nivel de confianza, 
asi que una confianza del 95% daria supuestamente un error del 5%, pero no siempre sera el complemen¬ 
to, ya que este porcentaje podra aumentarse o disminuirse dependiendo del grado de precision con que 
se desee hacer la estimacion. 


Pero hay otro tipo de error que no tiene nada que ver con el muestreo y que no se pue- 
de medir. Estos errores denominados ajenos a muestreo , no muestra es o sistematicos , se 
consideran como el resultado de instrumentos de medicion incorrectos, cuestionarios mal 
definidos, errores cometidos por el entrevistador al efectuar las preguntas o al interpretar las 
respuestas, preguntas vagas o ambiguas; en otros casos, como consecuencia de la influencia 
negativa del entrevistador, del mal diseno del formulario. Tambien podria ser el resultado 
en los procesos de critica, codificacion, tabulacion, en los cuales se pueden cometer errores 
ajenos al muestreo. 


a arian a: Del grado de variabilidad, depende en gran parte el tamano de la muestra. Por ejem- 
plo, el medico que realiza un analisis de sangre, el panadero que se come un pan, el cocinero que paladea 
una cucharada de sopa; cada uno de ellos ha hecho uso de una muestra. Observese que un centimetro de 
sangre, un pan o una cucharada de sopa, puede determinar el comportamiento de la totalidad (sangre del 
paciente, total de panes producidos en una jornada, total de sopa preparada para el almuerzo) debido al 
grado de homogeneidad que presenta la caracteristica observada; cualquier muestra que se tome de estas 
poblaciones se espera que de un resultado igual, representativo del total. 

Si todas las caracteristicas presentaran un alto grado de homogeneidad, seria muy sencilla la inves- 
tigacion por muestreo, pero esa situacion no se da en la mayoria de las poblaciones que se investigan; 
por lo tanto el tamano de la muestra debera aumentarse de acuerdo al grado de variabilidad, de tal forma 
que queden representados en ella los valores extremos que toma la variable. 

En el calculo del tamano de la muestra, lo ideal seria que la varianza se obtuviera en la poblacion 
investigada, pero en la mayoria de los casos esto no es posible, de ahi que exista la necesidad de estimarla 
mediante: 


□ Encuestas pre iminares , pi oto o pretest , sistema que consiste en la realizacion de una 
pequena encuesta, cuyo tamano por lo general se toma en forma arbitraria, fijandose un 
porcentaje que debe ser aplicado al tamano poblacional. Esta varianza, resultante de la 
encuesta, se considera un buen sustituto al de la poblacion. 

□ El empleo de la arian a obtenida en censos o investigaciones similares, realizadas con 
anterioridad. 

□ Otras veces son el resultado de conjeturas que se hacen sobre la poblacion. 
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Las encuestas pre iminares permiten, no solo estimar la varianza de las caracteristicas de aquellas 
variables que tienen que ver con el objetivo de la investigacion, sino que facilitan su conocimiento, fami- 
liarizan al entrevistador al aplicar el formulario, determinan las fallas del mismo, ademas, se puede cono- 
cer la reaccion del entrevistado, el tiempo necesario para cada entrevista y, como se dijo anteriormente, 
permite el calculo del error necesario para fijar el tamano optimo de la muestra. 

De igual modo la encuesta pre iminar permite hasta cierto punto, probar gran parte de los mecanis- 
mos tecnicos de muestreo, establecer costos, localizar unidades, comprobar si la medicion es practica, 
etc. 


La confianza: Se ha mencionado que el grado de precision depende de alguna manera, del tamano 
de la muestra y este, a su vez, de factores tales como el error, la varianza y la confianza. Esta ultima es 
fijada por el investigador quien, por lo general, trabaja con una Z = 2, valor correspondiente a un nivel 
de confianza del 95,5%; pero es posible que sean otros los valores de Z, tales como: Z = 2,57 (confianza 
del 99%) y Z=l,64 (90% de confiabilidad). Lo mas practico es trabajar con Z = 2 6 Z = 1,96, pero 
de todas maneras la decision sigue dependiendo del investigador, de la finalidad y del grado de precision 
que se desee. 

ama o de a pob acion : Es el ultimo componente de la formula, para calcular el tamano optimo de la 
muestra, cuando se trata de poblaciones finitas. 


EJERCICIOS PARA RESOLVER _ 

Nota: En el capitulo 7 (pag. 303) se trato este tema, con un gran numero de ejercicios. 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 

en Linea SIL. 

1. Decir si es cierto o falso a los siguientes puntos: 

a) Poblacion estadistica, es un conjunto de elementos que presentan una caracteristica comun. 
b) Una poblacion finita es aquella que esta formada por un limitado numero de elementos 
que presentan una caracteristica (cualitativa o cuantitativa), comun. c) La muestra aleatoria 
puede no ser representativa del universo o poblacion de la que se extrajo. d) El metodo 
de seleccion al azar, no esta basado en el calculo de las probabilidades. e) La muestra, es 
obtenida con el fin de investigar, a partir del conocimiento de sus caracteristicas particulares, 
las propiedades de toda la poblacion. f) Una de las ventajas del muestreo, es el de mayor 
control de la integralidad y calidad de la enumeracion. g) No es necesario utilizar la misma 
unidad de seleccion para la aplicacion del muestreo, que para la tabulacion y analisis. 

2. Decir si es cierto o falso a los siguientes puntos: 

a) A medida que aumenta el tamano de la muestra, disminuye el error, b) El intervalo comprendido 
entre los limites de confianza se llama intervalo de confianza. c) El metodo de seleccion de la 
muestra, debe ser completamente independiente de las caracteristicas que se desean examinar. 
d) Una de las ventajas de la seleccion al azar, es la poca necesidad del conocimiento previo de las 
caracteristicas del universo. e) Por la falta de actualizacion de la lista o registro de las unidades 
a ser investigadas, la muestra puede resultar sesgada. f) La expresion se conoce como 
«Factor de correccion para poblaciones finitas». g) El error no se da en las mismas unidades de 
medicion de la variable principal del estudio. 
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3. Decir si es cierto o falso a los siguientes puntos: 

a) La seleccion de informantes por parte de los entrevistados, expone el riesgo de introducir 
propensiones o vicios. b) El tamano de la muestra necesaria para alcanzar una cierta confiabilidad, 
no aumenta indefinidamente cuando crece el numero de elementos en la poblacion. c) El muestreo 
por proporciones se utiliza en especial, cuando se desea estimar las unidades en la poblacion que 
poseen alguna caracteristica cualitativa o atributo. d) El termino Afijacion optima, a menudo, 
se usa para metodos estratificados en los que se consideran tanto la variacion como el costo 
de la misma. e) El muestreo sistematico, consiste en seleccionar uno a uno los elementos de 
la muestra en un orden indeterminado. f) Cuando la fraccion de muestreo no es la misma en 
cada estrato, se habla de afijacion proporcional. g) La idea basica de la estratificacion, es la 
posibilidad de dividir una poblacion heterogenea o de gran variabilidad, en sub-poblaciones, 
cada una de las cuales es homogenea en cuanto a su composicion interna. 

4. Determinar en los ejercicios que se dan a continuacion, la clase de muestra (probabilistica o no 
probabilistica) y el metodo (aleatorio simple, estratificado, por conglomerados, sistematico, por 
conveniencia o cuotas). 

a) Poblacion: listado de nombres que aparecen en el directorio telefonico. Tecnica de muestreo: 
seleccionar un nombre por cada cincuenta. b) Poblacion: estudiantes matriculados en nuestra 
universidad, en el presente semestre. Tecnica de muestreo: ir a la cafeteria de la universidad 
y seleccionar un estudiante cada tercera mesa y entrevistarlo, o por cada tercer estudiante, en 
forma ordenada, seleccionar uno. c) Poblacion: alumnos matriculados en nuestra universidad, 
en el presente periodo academico. Tecnica de muestreo: elegir los primeros 80 alumnos que 
llegan a la Universidad el dia miercoles de una semana cualquiera. d) Poblacion: nombres 
de 1.000 familias con sus respectivas direcciones, anotadas en papelitos de igual tamano e 
introducirlas en una caja. Tecnica de muestreo: una persona extrae 100 papelitos, uno tras otro, 
removiendolos en cada extraccion. e) Poblacion: alumnos matriculados en la universidad, en el 
periodo academico actual. Tecnica de muestreo: durante una semana, entrevista a 50 alumnos 
por cada facultad. 

5. En cada una de las situaciones que se presentan a continuacion determinar la clase (probabilistica 
o no probabilistica) y tipo (al azar simple, sistematico, estratificado, por cuotas, conglomerados, 
etapas, areas, voluntario o por conveniencia) de muestreo. 

a) Poblacion: hojas de registro de pasajeros en el Hotel Hilton de Bogota. Tecnica de muestreo: 
tomar una hoja de registro a intervalos iguales. b) Poblacion: estudiantes matriculados en una 
universidad en el presente semestre academico. Tecnica de muestreo: con base en los listados 
dados por la Oficina de Registro Academico, tomar muestras de alumnos por cada facultad. 
c) Poblacion: los compradores en un supermercado durante una semana. Tecnica de muestreo: se 
informa por los diferentes medios de comunicacion, para que las personas que deseen colaborar 
con una investigacion, se dirijan a una determinada oficina a suministrar la informacion requerida. 

6. Diga cual de estos ejemplos corresponde al Muestreo aleatorio. 

a) Si de las jaulas de un criadero de conejos se toma una muestra de 10 animales, donde siempre el 
investigador saca aquellos animales que alcance con la mano. b) Con una poblacion pequena 
pero heterogenea, el investigador inspecciona la totalidad de ella y selecciona una muestra de 
unidades tipicas, es decir, unidades que a su parecer estan cercanas al promedio de la poblacion. 
c) Una muestra de frutas (mora), de un recipiente bastante grande, tomadas a 15 o 20 centimetros 
de la parte superior del recipiente. d) Una muestra de la cual el informante va a ser voluntario, 
cuando la informacion o la medicion es desagradable o penosa para la persona que esta siendo 
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investigada. e) Nombres y apellidos de mil personas colocados en capsulas identicas en un 
mismo recipiente. Una persona con los ojos vendados extrae 100 capsulas y despues de cada 
extraccion se revuelven las capsulas en el recipiente. 

7. El movimiento en el mercado de cierto producto alimenticio sera estimado, registrando las compras 
almacenadas del producto durante algunas semanas seleccionadas del ano. Analice las ventajas y 
desventajas de una seleccion sistematica de las semanas para este estudio. 

8. La universidad desea hacer una investigacion sobre rendimiento academico y condiciones socio¬ 
economicas de los estudiantes. Como seria el diseno del metodo de muestreo, si le pidieran hacerlo 
mediante el: 

a) Muestreo aleatorio simple, b) Muestreo por etapas. c) Muestreo voluntario. d) Muestreo 
estratificado. 

Explique como seria el procedimiento a seguir en cada metodo, si se sabe que hay 3 jomadas, 
10 semestres o niveles y 8 facultades en la universidad. Usted puede fijar condiciones para que 
se pueda aplicar cada metodo, como por ejemplo: el tamano de la poblacion, de la muestra, 
caracteristicas a estudiar, etc. 

9. Suponga, que una gran tienda de ventas al detal tiene sus cuentas por cobrar listadas por 
departamento. La empresa desea usar el muestreo para estimar en un dia especifico el total de las 
cuentas por cobrar. Analice los meritos relativos del muestreo aleatorio estratificado, del muestreo 
por conglomerados, del muestreo sistematico y del muestreo por conglomerados en dos etapas. 
^Que informacion adicional la gustaria tener sobre estas cuentas, antes de seleccionar el diseno de 
muestreo? 

10. El Directorio de una ciudad data de 4 anos atras y tiene las direcciones a lo largo de cada calle, con 
los nombres de las personas que viven en cada direccion. ^Cuales son las deficiencias de este marco, 
si se realiza una encuesta por muestreo? ^Durante los trabajos de campo pueden ser corregidas 
tales deficiencias? Al usar el directorio, ^extraeria usted una lista de direcciones o una lista de 
personas? 

11. Analice los meritos relativos al utilizar entrevistas personales, entrevistas por telefono y cuestionarios 
por correo como metodos de recoleccion de datos para cada una de las situaciones siguientes: 

a) Un ejecutivo de television quiere estimar la proporcion de televidentes que, en el pais, estan 
viendo el canal 11a cierta hora. b) El periodico El Espectador desea encuestar las actitudes del 
publico hacia el tipo de noticias que publica el diario. c) El alcalde de la ciudad, esta interesado 
en conocer la reaccion de los ciudadanos a las tarifas de los servicios publicos. d) La Secretaria 
de Salud de un municipio, quiere estimar la proporcion de perros que han sido vacunados contra 
la rabia, el ano pasado. 

12. Explique como obtendria una estimacion, sobre la proporcion de senoras que usan un nuevo 
detergente en el mercado, considerando solamente la ciudad donde usted vive. 

13. Una empresa de investigacion de mercados, ideo un plan de muestreo para estimar las ventas 
semanales de un cereal de la marca A en determinada region del pais. La empresa decidio tomar 
muestras de ciudades dentro del area y luego en supermercados dentro de esas ciudades. La medicion 
de interes es el numero de cajas vendidas del cereal en una semana especifica. Se tomo muestra 
de cinco (5) ciudades de las 20 en el area. ^Es este un problema de muestreo aleatorio simple?; 
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^muestreo por conglomerados en dos etapas?; 1 6 muestreo aleatorio estratificado de asignacion 
proporcional? Analice los meritos relativos de estas tres opciones y disene un plan de muestreo para 
cada caso. 

14. Un perito de seguridad esta interesado en estimar la proporcion de llantas de automovil en mal 
estado. ^Debera usar automoviles individuales o en grupos, tales como estacionamientos, como 
unidades de muestreo? ^Que marca podra usar? 

15. Una empresa de investigacion de mercados estima la proporcion de clientes potenciales que prefieren 
cierta marca de lapiz labial, mediante la seleccion aleatoria de 100 mujeres que llegan a su punto 
de venta, en un centro comercial. De las 100 mujeres seleccionadas, 65 de ellas manifestaron tener 
preferencia por la marca A, 

(a) ^Como estimaria usted la proporcion verdadera de mujeres que prefieren la Marca A, con un 
limite de confianza cualquiera para el error de estimacion?; (b) ^Cual es la poblacion objetivo 
de este estudio?; (c) /,Selecciono la empresa de investigacion de mercados, una muestra 
irrestrictamente aleatoria?; i De que manera cree usted que la realizo?; (d) ^Que opinion tiene 
usted de la aplicacion, en este caso, de una seleccion sistematica? 

16. El gerente de ventas de una empresa quiere medir la relacion entre las ventas y los costos de 
publicidad mensuales. ^Que parametros le sugeriria estimar? ^Por que? ^Que datos debe recolectar 
el gerente? 

17. Responda en forma breve cada uno de los siguientes interrogantes: 

a) Cuales son las diferencias que puede haber entre: a^ Muestreo sistematico o muestreo aleatorio 
simple; a 2 ) Muestreo de criterio, por cuotas y de conveniencia; a 3 ) Muestreo estratificado y por 
conglomerados. b) i En que casos a un investigador le interesaria obtener conclusiones mediante 
la realizacion de una muestra y no mediante la investigacion total? c) Explique brevemente 
el objetivo del muestreo. d) Explique los metodos de sustitucion que mas se utilizan en el 
muestreo. 

18. En una encuesta sobre salud de las personas en una ciudad, se parte de un mapa, se 
identifican los barrios, se enumeran y se efectua la seleccion sistematica, luego en cada 
barrio se lista y enumeran las manzanas, se hace una nueva seleccion al azar; se conforma 
un listado de viviendas para cada manzana, para luego hacer otra seleccion aleatoria. Para 
cada vivienda seleccionada se llena un cuestionario por cada persona o miembro. Se pide: 
a) Identificar la poblacion o poblaciones que presenta este estudio. b) Identificar el marco (o los 
marcos) que se debe elaborar. c) ^Cuales son las unidades?; d) ^Que metodo de muestreo debe 
aplicarse en este caso? e) Proporcione cuatro (4) caracteristicas a estudiar; f) Defina cuatro 
parametros a estimar. 

19. Un grupo de consumidores quiere determinar el sentir publico hacia cierto producto. En la ciudad 
donde se va a realizar el estudio por muestreo, se tienen cuarenta manzanas, con 10 casas cada una. 
a) Formule un metodo de dos etapas para realizar un muestreo aleatorio, seleccionando primero 

(10) diez manzanas y despues, en cada una de las manzanas, dos (2) casas. b) Si el objetivo es 
utilizar un plan de una etapa, ^como procederia usted? 

20. Una corporacion lista a sus empleados por grupos de ingresos (alfabeticamente dentro de cada 

grupo) desde el menor hasta el mas alto ingreso. Si el objetivo es estimar el ingreso promedio por 
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empleado, ^que metodo debera utilizar en una investigacion por muestreo: sistematico, estratificado 
o irrestricto aleatorio? Analice las ventajas y desventajas de cada uno de estos metodos. 

21. Un auditor se enfrenta a una larga lista de cuentas por cobrar de una empresa. El auditor debe 
verificar las cantidades con base en un 10% de esas cuentas, y estimar la diferencia promedio 
entre los valores revisados y los asentados en el libro. a) Suponga que las cuentas estan ordenadas 
cronologicamente, teniendo las mas antiguas una tendencia a tomar valores pequenos. Para 
seleccionar la muestra, ^usaria usted un muestreo de diseno sistematico o un muestreo irrestricto 
aleatorio? b) Suponga que las cuentas estan colocadas en forma desordenada para la seleccion de 
una muestra, ^usaria usted un diseno de muestreo sistematico o un muestreo irrestricto aleatorio? 
c) Suponga que las cuentas estan agrupadas por departamentos y que dentro de estos, estan listados 
en orden cronologico. Nuevamente las cuentas antiguas tienden a tomar valores mas pequenos. Para 
seleccionar la muestra. ^usaria usted un muestreo de diseno sistematico o un muestreo irrestricto 
aleatorio? 

TAMANO DE LA MUESTRA - M.A.S. 

Nota: Los siguientes ejercicios, complementan a los presentados en el Capitulo 7, en el que se 
explica con mas detalle el proceso de calculo, y se dan las soluciones en el SIL, en el mismo 
capitulo. 

22. Para efectos de planeacion economica en la Sabana de Bogota, es necesario estimar entre 2.200 
hatos: a) El numero de vacas lecheras por hato, con un error del 8% y una confianza del 95,5%; 
b) El rendimiento medio de leche por hato, con un error del 8% y una confianza del 95,5%; c) La 
proporcion de hatos con un rendimiento medio de leche superior a los 250 litros, un error del 8% y 
confianza del 95,5%. Una encuesta preliminar de tamano 40, arrojo las siguientes estimaciones: a) 
Promedio de vacas por hato, 46 y desviacion tipica, 40. b) Rendimiento medio de leche por hato, 
345 litros y varianza, 9.700 litros. c) 60% de los hatos con rendimiento medio de leche superior a 
250 litros. d) ^Que tamano de muestra recomendaria usted? 

23. Si en el ejercicio anterior se desea estimar el numero total de vacas lecheras en los 2.200 hatos, con 
un error de 8.000 vacas y una confianza del 95,5%. ^Que tamano de muestra se requeriria? 

24. Se requiere determinar el tamano de la muestra para el estudio de gastos semestrales, en productos 
de tocador, en una zona de Bogota. Para estimar la desviacion tipica de la poblacion, el investigador 
realiza una encuesta preliminar en 80 familias de dicha zona, encontrando una desviacion tipica de 
$250. a) /,Cual es el valor de n si se desea que el error estandar de la media inferida de la poblacion 
no exceda de ± 240, a un nivel de confianza del 95%? b) ^Cual es el tamano de la muestra si se sabe 
que en el barrio investigado viven 1.200 familias? 

25. Una empresa de transporte urbano permite que ciertos gastos de sus afiliados (gasolina, lubricantes 
y lavado) se haga mediante la utilizacion de la tarjeta de credito expedida para pago en las bombas 
de gasolina locales. La empresa ha expedido 10.050 tarjetas de credito. Se desea hacer una 
investigacion sobre la utilizacion de la tarjeta y otras caracteristicas. 

Para ello se realizo una encuesta preliminar de 90 tarjetas y se encontro que 63 de ellas fueron 
utilizadas para pagar servicios durante el mes de referencia. Por otra parte, el total de los gastos 
cancelados con tarjetas fueron de $2,390,000 y la desviacion tipica de $4,000. Se desea determinar 
el tamano de la muestra, con un error del 2% y una confianza del 95%, para estimar: a) la proporcion 
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de afiliados que utilizan la tarjeta; b) el gasto promedio mensual cancelado con tarjeta; c) El 
total del gasto mensual, cancelado con tarjeta; d) De los tamanos anteriormente obtenidos ^Cual 
aconsejaria usted? 

26. Decir si son ciertas o falsas las siguientes aseveraciones: a) Se dice que en todo proceso de seleccion 
debe haber sustitucion de las unidades que no se han podido entrevistar. b) El parametro describe una 
determinada caracteristica de las unidades que conforman la poblacion. c) El muestreo sistematico 
consiste en seleccionar uno a uno los elementos de la muestra en un orden indeterminado. d) A 
medida que aumenta el error, manteniendo constante la varianza, se aumenta el tamano de la 
muestra. e) Una muestra aleatoria es aquella en la cual ciertas unidades tienen mayor posibilidad 
que otras de ser seleccionadas. 

DISENO DE MUESTREO 

El dise o ye tama o de la muestra van a determinar la cantidad de informacion necesaria respecto a 
los objetivos de la encuesta. Recordemos que el objeti o de muestreo es contar con el mayor numero de 
unidades y la mayor cantidad de informacion, pero con el menor costo posible. 

A veces se cree, que con mucha informacion se logran buenas estimaciones; sin embargo, general- 
mente ocasionan despilfarro de dinero, perdida inutil de tiempo y complicaciones en la organizacion y 
analisis de los datos. Otras veces se peca por poca informacion, que hace temer por el exito de la inves¬ 
tigacion. Los dos casos se debe a que la muestra no fue correctamente disenada. 

Para el dise o de a muestra y ca cu o de tama o, se requiere que se hayan adelantado algunas 
etapas, tales como: 

a. P anteamiento de prob ema: nos permite determinar la necesidad, o no, de adelantar una 
investigacion que permita recoger o utilizar informacion que proporcione un mayor conocimiento 
del problema, aclarar algunas inquietudes y tener mas herramientas de juicio para la toma de 
decisiones. Supongamos que se tiene planteado como ejercicio de aplicacion: el problema de la 
mala calidad de la leche, la baja nutricion de los ninos, el precio elevado de este producto y su 
distribucion. 

b. Una vez determinada la necesidad de realizar la investigacion, debe estab ecerse e objeti o , o 
os objeti os de una manera clara y precisa, los cuales no deben perderse de vista, y si ser tenidos 
en cuenta a medida que se vaya avanzando, tanto en el diseno como en la instrumentacion de 
la encuesta. En nuestro caso, el ejercicio que desarrollaremos nos permitira aplicar algunos 
de los metodos de muestreo, la realizacion de estimaciones e interpretacion de las mismas. 
Consideraremos que el objetivo principal del estudio sera investigar el consumo de carne en uno 
de los barrios de la ciudad; como objetivos secundarios nos interesa conocer: las variaciones en 
el consumo; composicion y niveles de ingreso de la familia; ademas, se busca informacion sobre 
la calidad, precios, consumo de pescado y polio, distribucion, entre otros. 

c. Debemos determinar a pob acion objeti o , que debe estar claramente definida y plenamente 
identificable al iniciar el proceso de seleccion y la entrevista. Implica identificar la unidad o el 
elemento, la cual debe ser: c ara , mensurab e , adecuada y comparab e. En nuestro problema, la 
unidad corresponde a familias que viven en el barrio objeto de investigacion. Observemos que 
la familia es, en nuestro caso, a unidad de se eccion 
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d. Formu amos as hipotesis , ya sea para afirmar o rechazar. Anotaremos como ejemplo algunas de 
ellas, al considerar la mala calidad de la leche. 

- Hay tendencia a consumir leche de marca. 

- Se observan variaciones en las cantidades compradas, frente a variaciones de precios y 
marcas. 

- La posesion de neveras influye en los habitos de compra. 

- El consumo de leche aumenta con la poblacion escolar. 

- El consumo de leche por persona es bajo, en comparacion con el minirno nutricional 
recomendable. 

e. Se elabora el marco de referenda. Recordemos que es un istado de todas as unidades que 
constituyen la poblacion objetivo, y puede corresponder a un mapa o croquis que indique 
la localizacion de las unidades. En nuestro ejercicio con el cual desarrollaremos la teoria, el 
marco estara constituido por 355 familias, que ademas de estar completamente localizadas se 
encuentran numeradas desde 001 hasta 305. (Ver Tabla 13.1 en el SIL) 

f. Se establece el metodo de reco eccion , teniendo en cuenta las ventajas y desventajas que presenta 
cada unos de ellos, que nos permita hacer una buena seleccion. Algunos de estos metodos 
son: la entre ista , el correo, la entrega persona del cuestionario, el te efono y el pane . Para 
nuestro caso, se ha considerado la entre vista como el metodo de recoleccion mas indicado. 

g. Se seleccionara el metodo de muestreo a eatorio , dependiendo de la variabilidad que presente 
la caracteristica principal que tiene que ver con el objetivo de la investigacion. Aplicaremos el 
Muestreo A eatorio Simp e 

h. A esta altura se han desarrollado otras etapas tales como: la elaboracion del instrumento de 
recoleccion; la seleccion y preparacion del personal; se ha hecho examen de la documentacion, 
en especial para determinar si este tipo de estudio ya fue realizado y si existe alguna metodologia 
que se haya aplicado en una investigacion similar con buenos resultados; ademas, se cuenta con 
los recursos necesarios que permitan el buen desarrollo y terminacion del trabajo. 

i. En el diseno y determinacion del tamano de la muestra se hicieron algunas consideraciones que 

se deben tener en cuenta en una investigacion, siendo una de ellas el grado de homogeneidad o 
heterogeneidad que presenten las caracteristicas que se van a investigar, pues nos permite tomar 
decisiones respecto al metodo de muestreo que debe corresponder a la investigacion que se 
piensa realizar. 

FORMULARIO O CUESTIONARIO 

Se diseno un instrumento con el fin de recoger la informacion necesaria, de acuerdo a los objetivos 
establecidos en la investigacion. El cual debio ser sometido a prueba, realizando una encuesta preliminar 
o piloto, cuyo tamano fue elegido por el investigador teniendo en cuenta factores tales como: poblacion, 
objetivo, costos, tiempo y recursos humanos. 

En el caso de una poblacion de 355 familias, ubicadas en un determinado sector de la ciudad, el 
tamano de la muestra preliminar sera: fl = (%)(N) o sea fl = 0,04(355) = 14 familias. Recordemos que 
el porcentaje es arbitrario y lo determina el investigador, pero nunca puede ser mayor del 10%. 
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Presentamos a continuacion una parte del formulario y seguidamente el marco o listado de las 355 
familias (incluimos informacion de algunas caracteristicas que luego seran recolectadas, tanto para la 
muestra piloto como la definitiva con la cual se haran los estimativos). Ver informacion en el SIL ca- 

pitulo 13 (Tabla 13.1). 


Realiza el departamento de 
investigacion y mercadeo 

ENCUESTA SOBRE INGRESO Y CONSUMO DE CARNE 
DE LAS FAMILIAS EN EL BARRIO FUTURO / 2006 

Direccion_Ciudad_Fecha_ 

Telefono_ 


I. GENERALIDADES 

Nombre del informante: _ 

Direccion:_Telefono: 

Ocupacion:-Edad: — 


II... 

Ingreso mensual: 




Propiedad de la vivienda 


□ 

2.1 Propietario 

Consumo diario de carne: 

gramos 

□ 

2.2 Inquilino 


Si se fuera a hacer una investigacion total, la informacion sobre algunas caracteristicas: ingreso 
(miles de $); propiedad vivienda; total personas por sexo y ocupacion; y consumo de carne diaria (en 
gramos) se tendria que utilizar toda la informacion de las 355 familias tal como aparece en el SIL, (Ca- 
pitulo 13). 


APLICACION DE METODOS Y TECNICAS DE MUESTREO 


MUESTREO ALEATORIO SIMPLE (MAS) 

Tamano de la muestra 

En la practica es muy frecuente que no se conozca la varianza de la caracteristica en la poblacion 
(a 2 ); en tales casos se debe recurrir a censos, a investigaciones similares realizadas con anterioridad o a 
investigaciones preliminares, denominadas encuestas pi oto. Este ultimo procedimiento es el que mas 
se emplea para determinar el tamano de la muestra, partiendo del supuesto de que no existe informacion 
sobre la poblacion. En primer lugar, se elabora un listado de las familias a investigar que conforman el 
marco muestral, tal como aparece en el cuadro 13.1 ( er capitu o 1 en SI ). Despues de haber identi- 
ficado la poblacion a la cual se va a investigar, definida claramente la unidad de investigacion y las ca¬ 
racteristicas que tienen que ver con el estudio, se procede a establecer el tamano optimo para la muestra. 
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Para disenar la muestra es indispensable contar con un marco de referenda, es decir, la lista, mapa 
u otra especificacion de las unidades, que resulta de la informacion previamente disponible, respecto a 
la poblacion sobre la cual se basan los esquemas particulares de muestreo. En nuestro caso, el marco 
estara constituido por una lista de 355 familias. La familia o unidad de investigacion se ha definido como 
el conjunto de personas, (del barrio El Futuro), que viven bajo un mismo techo, ligadas por un lazo de 
consanguinidad y dependencia economica. Una vez identificada y enumerada la poblacion, se procede 
a calcular el tamano de la muestra, mediante algunas de las formulas que se presentan a continuacion: 


(1 )n = 


n 


o 



/2C2 

donde n = ——— 

° E 2 


(2 )n = 


NZ 2 S 2 
NE 2 + Z 2 S 2 



Como no se conocen las varianzas poblacionales, de una o algunas de las caracteristicas que tienen 
que ver con el objetivo principal de la investigacion, se procede a estimarlas mediante una encuesta pi- 
oto o pre iminar siendo : 


n pi]ot = 4% (n) n pilot = 0,04 (355) - 14 familias 


El porcentaje del 4% es arbitrario, corresponde a una decision del investigador, en algunos casos 
depende: del tamano poblacional, tiempo y costos, nunca podra ser mayor al 10%, el cual se considera 
grande. Una vez establecido el valor de fl piloto, se utiliza cualquiera de los metodos de seleccion alea- 
toria ya presentados en este capitulo. Es necesario recordar que hasta el momento se esta utilizando el 
M.A.S. (Muestreo Aleatorio Simple), donde las unidades o los elementos se seleccionan sin reposicion, 
todas con igual probabilidad de ser elegidas. 

Luego se realiza la seleccion, ya sea mediante el uso de Calculadoras, Tablas de numeros aleatorios 
o del Programa EXCEL, las 14 familias que formaran la muestra pi oto, (la poblacion esta numerada 
desde 001 hasta 355), sin tener en cuenta numeros superiores o repetidos. Supongamos que se obtuvieron 
los siguientes numeros aleatorios con los cuales elaboramos la tabla: 


335 

004 

289 

128 

097 

271 

253 

348 

202 

349 

197 

018 

020 

207 


Informacion obtenida mediante la Encuesta Pre iminar o Pi oto 


Na 

Orden 

Numeros 

Aleatorios 

Ingresos 
(Miles $) 

Vivienda 

Propia 

No. total de 

personas 

M 

F 

Trabajando 

Consumodiario 

decame(grs.) 

1 

335 

2.420 

si 

3 

1 

2 

1 

760 

2 

004 

1.060 

si 

3 

1 

2 

1 

765 

3 

289 

2.860 

no 

3 

1 

2 

2 

592 

4 

128 

2.320 

no 

3 

1 

2 

2 

520 

5 

097 

1.120 

si 

3 

1 

2 

1 

610 

6 

271 

2.500 

si 

5 

1 

4 

2 

636 

7 

253 

1.930 

si 

2 

0 

2 

2 

650 

8 

348 

1.020 

si 

3 

2 

1 

1 

605 


ontin a 




















CAPfTULOTRECE 

ALGUNOS METODOS DE MUESTREO 


ontinuacion 


9 

202 

1.960 

si 

2 

1 

1 

1 

642 

10 

349 

1.110 

no 

2 

0 

2 

1 

520 

11 

197 

970 

no 

2 

1 

1 

1 

508 

12 

018 

1.790 

no 

4 

2 

2 

1 

767 

13 

020 

2.250 

no 

3 

1 

2 

2 

842 

14 

207 

1.750 

si 

2 

0 

2 

1 
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Para el calculo del tamano muestral, por lo general se selecciona la caracteristica principal, en nues- 
tro caso podria ser el consumo o el ingreso. Sin embargo se seleccionan los dos para comparar y explicar 
sus resultados, a esto le anadimos la caracteristica cualitativa (propiedad vivienda), para que veamos 
como se trabaja con atributos. 

Con la anterior informacion obtenida de la encuesta preliminar, se determina la varianza y se cal- 
cula el tamano optimo de la muestra, dependiendo de las caracteristicas que hayamos seleccionado. 
Veamos los resultados, cuando trabajamos con un error de muestreo del 5% para las variables (ingreso 
consumo ) y del 8 % para el atributo {propiedad de a i ienda). La confianza en los tres casos sera del 
95,5% (Z=2). 

a. Ingreso promedio (mi es de pesos) x = _ 1.790 ($ 1790.000) 

n 14 


E = 0,05 ( a) = 0,05 (1.790) = 89,5 (ochenta y nueve mil quinientos pesos) 


S= . ^ - f : s = = SO. ■55.400 - 14(1.7%)= _ 46 

n- 1 14-1 


n = 


o 


Z 2 S 2 
E 2 " 


Z 2 S 2 _ 2 2 (407.538,46) s 2Q3 5 
E 2 ~ 89,5 2 


n = 


1 + 


N 


n 


203,5 


1 + 


203,5 

355 


130 familias 


n = 


NZ 2 S 2 
NE 2 + Z 2 S 2 


355(2 2 )(407.538,46) 

U 355(89,5 2 j +2^407.538,46) 


130 familias 


Tambien se puede calcular mediante: 


V! — 

s 2 


407.538,46 

ri 

1 

E\ 2 ^ S 2 

/ 89,5) 

r , / 407.538,46 \ 

(- 

z) N 

^ 2 > 

I+ 1 355 ) 


130 familias 


Algunos utilizan la formula con correccion, ya que se considera que la varianza obtenida mediante 
una encuesta preliminar, cuando esta es muy pequena, se hace poco representativa, es decir, que el resul- 
tado de n es menor que el obtenido con varianza poblacional. 
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Procedemos al calculo de n con correccion: 
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Z 2 S 2 

r_ 2 i 

' 


i + — 

n = 

. E 2 . 

L n.\ 



2 2 (407.5 3 8,46) 


89,5 2 


1 + 


14 


= 232,58 


232,58 lyil r . r 
n = -= 141 familias 


1 + 


232,58 

355 


El tamano de la muestra obtenida al ser corregida, va a ser un poco mayor en comparacion que 
cuando no es corregida. Si fuera necesario calcular el total de ingresos de las 355 familias, el tamano de 
la muestra arrojaria los mismos resultados anteriores, a pesar de que la formula es ligeramente modifi- 
cada. 


Z 2 N 2 S 2 
“ E 2 


n = 


i, = 2--(355^)(407.53 M_6) = : 

° 31.772,25 2 

b. onsumo promedio de carne diaria porfami ia 
Zx. 9.101 

x = —L= -= 650,07 

n 14 


E = N(0,05) (x) = 355(0,05)(1.790) = 31.772,25 
203,5 


1 + 


203,5 

355 


= 130 familias 


S 2 = 


Xx 2 - nx 2 

_ i _ 

n- 1 


6.054.547 - 14(650,07) 2 
14- 1 


E = 0,05 (x) = 0,05(650,07) = 32,50 
Z 2 S 2 _ 2 2 (10.636,38) 


= 10.636,38 

S = 103,12 
E 2 = 1.056,48 


E 2 


1.056,48 
40,27 


= 40,27 


1 + 


1 + 


40,27 


= 37 familias 


N * 355 

Tambien se puede calcular mediante la formula: 

NZ 2 S 2 _ 355(2 2 )(10.636,38) 


NE 2 + Z 2 S 2 355(32,50 2 ) + 2 2 (10.636,38) 

Otra forma de calcular el tamano optimo, es asi: 

S 2 . , 10.636,38 


37 familias 


© 


siendo: n = - 


^ + 


N 


(¥)* 


10.636,38 


- 37 familias 


355 
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Cuando hay cierto grado de homogeneidad en la caracteristica investigada, el tamano tiende a ser 
pequeno, tal es el caso observado con el consumo de came diaria donde se obtuvo 37 familias. El grado 
de homogeneidad se establece cuando el coeficiente de variation calculado es menor del 30%; en estos 
casos es recomendable la aplicacion del Muestreo A eatorio Simp e , en caso contrario es aconsejable el 
muestro aleatorio estratificado, siendo en nuestro caso, la variable ingreso. 


CV= — 100 CV= —100 = 15,86% CF = —— 100 = 34,36% 

j- 650,07 1.790 

(Consumo de came) (Ingresos) 


Con los anteriores resultados hay dos posibilidades, o se trabaja con una muestra grande (130 fa¬ 
milias) o se aplica el muestreo aleatorio estratificado como se hara mas adelante, cuando calculemos el 
tamano optimo por ese metodo, con lo cual se obtiene una mejor estimacion con las mismas caracteris- 
ticas seleccionadas. 


c. Proportion defami ias con i ienda propia 


II 

8 

14 

=0,57 

Z 2 PQ 


Z 2 Sp 

E 2 


E 2 

n 

o 


153,18 

n 

1 + —^ 


1+ 153,18 


E= 8%-0,08 


2 2 (0,2451) 

n = - =153,18 

° 0„08 2 


= 107 familias 


N 


355 


Tambien se puede aplicar mediante la siguiente formula: 


* =-^Q- 

NE 2 + Z 2 PQ 


355(2 2 )(0,57)(0,43) 
355(0,08 2 ) + 2 2 (0,57)(0,43) 


107 familias 


Si en alguna ocasion seleccionamos mas de una caracteristica, para calcular el tamano optimo, nos 
decidimos por aquel cuyo resultado sea el mas alto, en este caso, seria 130 familias, si incluimos la ca¬ 
racteristica vivienda. 


Calculo de algunos estimativos 

Se ha dicho que la estimacion de un parametro se hace a traves de los resultados obtenidos con la 
muestra. Si solo se utiliza una cifra unica para las caracteristicas, tales como: promedio, proporcion o 
razon, etc., se le denomina estimation puntua 

Si se desea determinar unos Limites de confianza dentro de los cuales debe estar probablemente el 
parametro, es denominado como estimacion por intervalo o limites de confianza. Se podra hablar de una 
estimacion total, cuando se hace referenda a la totalidad de la caracteristica en la poblacion. 

El proceso a seguir una vez determinado el tamano de la muestra, consiste en la realizacion de la 
verdadera encuesta para la obtencion de la informacion; luego se continua con el proceso de tabulacion o 
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recuento, lo que permitira la elaboracion de cuadros y el calculo de los diferentes estadlgrafos o medidas 
(promedios, razones, varianza, etc.), denominados estimadores de os parametros 

Vale la pena observar este proceso de estimacion (puntual y por intervalos) desarrollando el ejerci- 
cio de las 355 familias que se tomaron para el calculo de n. Primero se calculan los promedios para datos 
sin agrupar, es decir, datos originales y luego (cuando asi se requiera) para datos agrupados (tablas de 
frecuencias). Supongamos, que el tamano optimo de la muestra obtenida por cualquiera de los metodos 
anteriores y caracteristicas utilizadas es de 28 familias en vez de las 130 familias establecidas, (valor ar- 
bitrario que no tiene nada que ver con los resultados anteriores), tornados unicamente con la intencion de 
facilitar la aplicacion de la «t» de Student, valido para muestras pequenas (n < 30), casos poco usuales en 
la practica, pues casi siempre se trabaja con muestras grandes (n > 30) donde utilizamos Z. La muestra, 
como en todos los procesos, va a ser aleatoria y el metodo aplicado sera el de muestreo aleatorio simple, 
donde las probabilidades de seleccion de cada unidad se van a hacer constantes y a se eccion a a ser 
sin repeticion 

Nuevamente se utiliza la calculadora o el programa EXCEL para obtener los 28 numeros aleatorios, 
sin repeticion: 


170 

045 

186 

217 

076 

213 

132 

087 

006 

163 

312 

111 

248 

018 

096 

224 

303 

196 

230 

286 

032 

168 

318 

009 

144 

250 

036 

095 


Informacion obtenida con la muestra de 28 familias. Datos sin agrupar. 


No. 

ORDEN 

NUMEROS 

ALEATORIOS 

INGRESOS 

(Miles ) 

VIVIENDA 

PROPIA 

No. TOTAL DE 

PERSONAS 

M 

F 

TRABAJANDO 

CONSUMO DIARIO DE 

CARNE (grs.) 

1 

170 

2.700 

si 

3 

1 

2 

2 

812 

2 

045 

1.920 

si 

2 

1 

1 

2 

630 

3 

186 

880 

no 

3 

1 

2 

1 

510 

4 

217 

860 

si 

5 

2 

3 

1 

506 

5 

076 

1.840 

no 

5 

1 

4 

2 

620 

6 

213 

1.860 

no 

3 

2 

1 

1 

716 

7 

132 

1.260 

si 

3 

2 

1 

1 

520 

8 

087 

2.060 

si 

5 

1 

4 

2 

780 

9 

006 

1.700 

no 

2 

1 

1 

2 

895 

10 

163 

960 

no 

3 

2 

1 

1 

520 

11 

312 

1.890 

no 

4 

3 

1 

2 

576 

12 

111 

1.110 

si 

3 

1 

2 

1 

620 

13 

248 

1.980 

si 

3 

1 

2 

2 

586 

14 

018 

1.790 

no 

5 

1 

4 

2 

760 

15 

096 

1.000 

no 

2 

0 

2 

2 

650 

16 

224 

1.520 

no 

6 

2 

4 

2 

666 

17 

303 

3.460 

si 

4 

1 

3 

3 

718 

18 

196 

950 

no 

3 

1 

2 

1 

515 

19 

230 

980 

si 

2 

1 

1 

1 

560 

20 

286 

1.950 

si 

5 

1 

4 

2 

710 

21 

032 

960 

si 

2 

1 

1 

1 

782 


ontin a 
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ontinuacion 


No. 

ORDEN 

NUMEROS 

ALEATORIOS 

INGRESOS 

(Miles ) 

VIVIENDA 

PROPIA 

No. TOTAL DE 

PERSONAS 

M 

F 

TRABAJANDO 

CONSUMO DIARIO DE 

CARNE (grs.) 

22 

168 

1.640 

no 

5 

2 

3 

2 

720 

23 

318 

1.760 

si 

2 

1 

1 

1 

543 

24 

009 

2.820 

no 

4 

2 

2 

3 

742 

25 

144 

1.880 

no 

3 

1 

2 

2 

560 

26 

250 

2.060 

no 

2 

1 

1 

2 

616 

27 

036 

1.450 

no 

2 

1 

1 

2 

580 

28 

095 

1.010 

no 

2 

1 

1 

1 

630 

2 


46.250 

12 (si) 

93 

36 

57 

47 

18.043 


Los limites para los estimadores se fijaran con una confianza del 95%. En caso de que la muestra 
sea grande (n > 30) se utiliza = 1,96. En este caso, siendo n < 30, aplicamos la “t” de Student; en 
primer lugar se establecen los grados de libertad n (letra griega nu) igual a/I-1 o sea V = 28-1=27, 
siendo a = 0,05 complemento del 95%, tornado como nivel de confianza (la suma sera del 100%); por 
lo tanto el valor de “t” para este ejercicio sera igual a 2,052. 

Veamos ahora los estimati os puntua es y de inter a os para algunas de las caracteristicas que apa- 
recen en el cuadro anterior. 


ESTIMACION DE PROMEDIOS Y TOTALES 


(1) Promedio de Ingresos por fami ia : Los estimativos de promedio y total de los ingresos (miles de $) 
por familia, se calculan de la siguiente manera: 


x = 


Xx 


46.250 


s~= 


n 28 

Xx 2 - nx 2 


= 1.651,78 => $1.651.780,oo 

2 87.416.300 - 28(1.651,78) 


n - 1 


s~= 


28- 1 


= 408.212,57 


S = ^408.212,57 = 638,91 


El estimati opuntua opromedio es de $1.651,79, equivalente a un ingresopromedio estimado para 
las 355 familias de $1,651,785,71 

La estimacion con intervalos de un 95%, sera: 


X= x±t f [N=h" 
v» 1 N-l 




/= fraccion de muestreo; / = ^ = 0,078; Aplicada como factor de correccion para 

poblaciones finitas, cuando la fraccion sea mayor del 5%. 


X= 1.651,79 ±2,052 


' 638,91 

. J28 


1-0,078 = 




1.889,69 = $!.889.691,23 


^ 1 . 


413,89 = $1,413,888,77 
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Estos resultados indican que el ingreso promedio poblacional debera estar aproximadamente entre 
$1,413,89 y $1,889,69 (miles de $); con una probabilidad o confianza del 95%; sin embargo queda un 
margen de error del 5%, es decir, el promedio verdadero puede ser superior o inferior a esos valores. 
Se sabe que el valor de la media pob aciona o a or erdadero , es de $1,782 o $1,782,000 el cual se 
encuentra dentro de esos limites de confiabilidad. De los estimativos anteriores es preferible deducir que 
el promedio poblacional debera estar dentro de esos limites con cierto nivel de confianza, que considerar 
a $ 1.651,79 como si fuera el promedio verdadero de la poblacion. 

Por otra parte, en el proceso de una investigacion por muestreo, es comun la formu acion de hi¬ 
potesis que deben ser comprobadas. Por ejemplo, el investigador de las 355 familias puede considerar 
como hipotesis que el ingreso de esas familias es de $1,750,000 ante la altemativa de que sea diferente, 
es decir, que puede ser mayor o menor a $1,750,000. En este caso el procedimiento que se sigue para 
contrastar esta hipotesis es: 


1 ) 

2 ) 

3 ) 


Ho: 
Ha: 
a = 

✓N 

Hi = 


n = 1.750 (Hipotesis nula) 

(1 — 1.750 (Hipotesis altemativa) 

0,05 (nivel de significacion) 


x s = 1.889,69 
1 = 1.413,89 


(Limites de confianza) 


(4) Como la hipotesis nu a (Ho: p = 1.750) se ubica dentro de los limites de confianza, se acepta 
lo indicado por el investigador, es decir, que el ingreso promedio de las familias puede ser considerado 
como de $1,750 6 $1,750,000. 


Observese en el ejercicio puesto a consideracion dado su tamano y una informacion supuesta, se 
pudo conocer la media poblacional (p = 1.782) lo cual, en la practica no sucede con frecuencia; ademas 
se esta afirmando que el ingreso es de $ 1.750 cuando en realidad fue $ 1.782; por tanto se ha cometido un 
error de tipo II. Si se quiere probar que el grupo familiar investigado tenga un nivel de ingresos inferior 
a 1.750 (miles de $), no se deben utilizar los limites de confianza, para constatar la hipotesis; el procedi¬ 
miento a seguir es: 



v 

a 


n -1=21 
0,10 


} 


t = -1,703 


RC = Region Critica o de rechazo 
ZA = Zona de Aceptacion 
t =-1,703 puntocritico 


A1 nivel del 5%, se estara aceptando que el nivel de ingresos es de $1,750,000 y se estaria come- 
tiendo un error de tipo II, ya que estamos aceptando un ingreso de $1,750,000, cuando en realidad es de 
$1,782 (miles de $) (Estamos aceptando algo falso). 
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La estimation de tota de ingresos para las 355, se procede mediante la aplicacion de la siguiente 
formula: 


v = N x ± t 

■ h 


1 -/ 


X = 355(1.651,79) ± 2,052(355) 


'638,91' 


■ ^28~ ■ 

I 


1- 0,078 


X= 586.385,45 ±84.454,94 




$670,840,39 

$501,930,51 


(miles $) 


El ingreso tota para las 355 familias se estima en $ 586.386.450, pero el valor verdadero puede 
estar entre $670,840,390 y $501,930,510 con una seguridad del 95%. 

Promedio de personas porfami ia 

Para determinar los limites de confianza del 95%, se debe calcular la media y la desviacion estandar. 


Ex. 93 
n ~ 28 


= 3 3214 


X ; =x ±t 


_s_ 




Ex - nx 2 

i _ 

n - 1 


351 -28(3,3214)- 
^ 27 


= 1,2488 = 1,25 


5 = 1,25 


X 


3,32 ±2,052 


1,25 

V28~ 


^ 1- 0,078 = 




3,79 

2,85 


Promedio de personas 
por familia. 


El total de personas para las 355 familias, sera obtenido asi: 


X = Nx ± t h!s 

y v s /— 

1 


1 -/ 


X s = 355(3,32) ±2,052 

I 

X = 1.178,6 ± 165,24 


(355)(1,25) 

'Gs -I ^ 

y, 1.343,84 
1.013,36 


1-0,078 = 


Total de personas 


Se puede afirmar que, aproximadamente, el numero total de personas para las 355 familias es de 
1.179; sin embargo, con una confianza del 95%, el total poblacional debera estar entre 1.013 y 1.344. Com- 
parado el total poblacional (1.164) con el estimador puntual, se aprecia una pequena diferencia y, como en 
los casos anteriores, el valor se encuentra incluido dentro de los limites de confianza establecidos. 
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ESTIMACION DE PROPORCIONES Y TOTALES 

Proportion defami ias con i ienda : Para el calculo de la proporcion y la varianza se procede asi: 

Ztf. 12 

P = = — = 0,4286 6 42,86% s p 2 = pq = 0,4286(0,5714) = 0,2449 

El 42,86% o 43% es el estimador puntual, es decir, se estima que el 42,86% de las familias son 
propietarias de vivienda. 

Para obtener los Limites de confianza, se aplica la siguiente formula: 

y, 0,6163 = 61,63% 

^ 0,2409 = 24,09% 


P = 0,4286 + 2,052 

a s 3 — 3 


0,2449 

27 


V 1-0,078 


Analicemos los anteriores resultados: en primer lugar, el estimador puntual fue de 42,86% y el 
verdadero (poblacional) es de 48,73%, el cual se encuentra ubicado dentro de los Limites de confianza 
del 95%. 

En la formulacion de hipotesis, se procede en forma similar al promedio. Supongamos que el inves- 
tigador asegura que el 45% de las familias son propietarias de las viviendas. 


1. Ho: P = 0,45 
Ha: P = 0,45 

2. a = 0,05 

3. Como 0,45 esta dentro de los limites de confianza (24,09% y 61,63%), se acepta la hipotesis 
nula, es decir, que el 45% de las familias son propietarias. Ahora, si observamos la proporcion verdadera 
(48,73%), notamos que se ha cometido un error de tipo II (aceptar algo falso). En una prueba unilateral, 
por ejemplo, si el investigador considera que el porcentaje puede ser inferior al 45%; en este caso se 
debera proceder de la siguiente manera: 



El valor t = -0,22 se ubica en la zona de aceptacion, por lo tanto, al nivel del 5%, no existe suficien- 
te razon para considerar que el porcentaje de familias propietarias sea inferior al 45%. Aqui tambien se 
comete un error de tipo II, dado que el promedio verdadero es superior al 45%. 
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ota defami ias con i ienda 

Para la estimation de tota es, se aplica la siguiente formula: 

f o 2449 *_ 218,77 ^ 

A,= 355(0,4286) ±2,052(355) iU—— V1- 0,078 = + A = 355(0,4286) = 152 familias 

■ * 27 85,54 

El estimado puntual (total) es de 152 familias con vivienda propia; y el estimado por intervalos, el 
numero verdadero de propietarios de vivienda, debera estar entre 86 y 219 familias, con una seguridad 
del 95%. 


ESTIMACION DE PROPORCIONES Y TOTALES EN CONGLOMERADOS 

(una etapa) 

En el calculo del estimador de a proportion de tota de mujeres por familia, se le debe dar el trata- 
miento de cong omerados desigua es , ya que cada familia se constituye en un conglomerado y el numero 
de personas que lo conforman es diferente en cada una de ellas. 


Para e estimado de a proportion de mujeres se tendra: 


P = 



numero de mujeres 
total de personas 


p = — = 0,6129 = 61,29% 
F 93 


f 1 -/ | 

+ p 2 Y,mf 

. n fn 2 . 

77-1 


p = 0,6129 + 2,052 

1 S 5 - 5 


n 28 ' 

1 355 

151 - 2(0,6129)(223) + (0,6129) 2 (351) 

\||_28(3,32) 2 

28-1 


E ^ ^* 0,6785 = 67,85% 

m = JUx =- = 3 f 32 p = 0,6129 ±2,052(0,032) = 

n 93 1 ^0,5473 = 54,73% 


El estimador puntual de 61,29% corresponde al porcentaje de mujeres, por tanto el 38,71% seran 
hombres. En la poblacion (355) se obtuvo que el 57,47% eran mujeres y el 42,53% hombres. Por otra 
parte, la proporcion de mujeres (en la poblacion) queda incluida dentro de los limites de confianza del 
95%, establecida con la muestra. 


Para el planteamiento de la hipotesis (nula y alternativa) se sigue el mismo procedimiento realizado 
para la proporcion; siendo innecesario repetir el proceso. 


En e estimati o de tota es , se seguira el proceso visto para la proporcion: 


\=Mp ± tM 


[i-/ l 

'Xa 2 IpLapi. + p 2 'Lm 2 i ' 

m nTn 2 . 

77-1 


M = total de personas en 
los 355 conglomerados. 
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El total de personas se estima de la siguiente manera: 


M - 355(3,32) - 1.178,16— 1.179 (El total verdadero es de 1.164 personas) 


^ 800,03 = 800 

As x = 1.179(0,6129) ± 2,052(1.179) (0,032) ^ 

^ 645,19 = 645 


Total de mujeres 
en las 355 familias 


El total verdadero para la poblacion de 355 familias es de 669 mujeres en relacion a las 723 obte- 
nidas a traves de la muestra; ademas, observemos que ese total, como en todos los casos anteriores, se 
encuentra dentro de los limites de confianza. 


ESTIMATIVOS DE RAZONES COMO METODO INDIRECTO PARA ESTIMAR 
PROMEDIOS Y TOTALES 


En el caso de una Razon: mujeres/hombres, se pueden hacer estimativos indirectos sobre el promedio y 
total de mujeres en las 355 familias. Veamos como se realiza este proceso: 


Estimado de la Ra on: mujeres/hombres 

^ ^ R ^ 1 — mu J eres 

Zx x hombres 

i i 



57 

36 


1,58 


Lo anterior indica, que aproximadamente por cada tres mujeres hay dos hombres. Este valor corres- 
ponde a un estimador puntual; en la poblacion, el valor de la razon es de 1,35. 


Para los limites de confianza en una razon se emplea la siguiente formula: 


f 1 -/ | 

'^y 2 -2'k^yx i l R 2 Ix 2 ' 

. n* 2 

n - 1 


R = 1,58 ±2,052 

s 


fl 28 -I 

\ 355 

151 - 2(1,58)(72) + (1,58) 2 (56) 

\ |_28(1,29) 2 

1- 28-1 J 


Se puede trabajar con = 1,2857 6 X= 1,39, pero es usual emplear la media aritmetica obtenida 
a traves de la muestra. 2,02 

2,02 

= 1,58 ±2,052(0,2152)= Q 
1 1,14 

La media o el promedio obtenido en forma indirecta a traves de una razon se calculara de la siguien¬ 
te manera: 


[!-/ 1 

' Zy 2 -2k Xjx, i R 2 Jxf 

n 

n - 1 


Reemplazando, siendo x = 1,29 sera: 
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- , 28 

151 - 2(1,58)(72) + (1,58) 2 (56) , 355 


28- 1 


28 


Y~ = (1,58)(1,29) ±2,052 ^ 

- 2,61 

=2,04 + 0,57 v Es el promedio de mujeres por familia. 

1,47 


Se podra obtener el total de mujeres en las 355 familias, usando el metodo indirecto a traves de una 
razon: 




\x+tN 

1 -/ 1 

' Xy;- 2fi Xvx + /fix;' 

> 1 

n 

n - 1 


x 924 

Y = 355(2,04) ± 355(0,57) = 724 ±200 (T Mujeres 

* ^*524 

ESTIMACION DE PROMEDIOS Y TOTALES MEDIANTE LA REGRESION 

La estimacion de promedios tota es , utilizando la regresion inea y una ra on , son considerados como 
metodos indirectos de estimacion. El termino regresion fue inicialmente empleado por Galton, con el fin 
de iniciar ciertas relaciones en la teoria de herencia biologica (padre e hijo), aunque con posterioridad el 
termino se hizo extensivo al metodo estadistico que trata de cuantificar la relacion existente entre dos o 
mas variables. 

La regresion se aplica a variables que tengan una relacion logica, es decir que haya una relacion de 
causalidad entre las variables. Cuando se ha comprobado la existencia de causalidad directa entre dos 
o mas variables, es necesario determinar la funcion matematica que represente adecuadamente dicha 
relacion. Con las informaciones obtenidas y mediante la construccion de una grafica, se podra decidir si 
la funcion adecuada es la de una recta parabo a e ponencia potencia etc. Una vez determinada la 
funcion, se calculan los parametros. 

En la regresion inea simp e solo intervienen dos variables, una dependiente o predictando y otra 
independiente o predictor. 

La regresion aplicada como tecnica de muestreo, es un metodo indirecto para realizar estimaciones, 
de promedios y totales, lo mismo a partir de una razon (R). La importancia de estos metodos radica en 
el mejoramiento de los procedimientos de estimacion. A menudo se emplea la regresion inea entre dos 
variables, por ser la mas sencilla de realizar aunque no siempre la mas apropiada para un conjunto de 
observaciones. Por tal razon se recomienda realizar un trabajo preliminar a fin de determinar si el modelo 
lineal es el mas aconsejable. El metodo mas sencillo, para determinar que tipo de linea se ajusta mejor a 
ese conjunto de datos, es la graficacion; permite visualizar si la relacion lineal es apropiada; en caso con- 
trario, se debe buscar un modelo no lineal. Una vez efectuadas las estimaciones, es necesario determinar 
el grado de correspondencia o dependencia que exista entre las dos variables, mediante el calculo de un 
indiee abstracto denominado coeficiente de correlacion al cuadrado, simbolizado por R 2 y cuyo valor 
oscila entre Oyl. (0<R 2 <1) 

La ecuacion de la recta Y en X se expresa de la siguiente manera, para las variables poblacionales: 

(Y = c + b |, siendo Y la caracteristica cuantitativa o variable objeto de estudio, denominada ariab e 
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dependiente o predictando; es una variable auxiliar supuestamente conocida y relacionada cony, deno- 
minada ariab e independiente o predictor. 

es el coeficiente angular e indica la relacion entre la variacion de Y y la variacion de . Tambien 
se le conoce con el nombre de coeficiente de regresion de Y en X o pendiente de la recta. 

c es el coeficiente de posicion, denominado tambien origen de la ordenada y corresponde al seg- 
mento interceptado sobre el eje de la Y (ordenada) en un piano cartesiano. 

Cuando se estima el valor promedio Y, se obtendra mediante las ecuaciones: 

Y^ = c + bX o Y L =y + 6 (X-x) 

Siendo Y el estimador del promedio poblacional de la variable; X e s el promedio en la poblacion 
de la segunda variable, supuestamente conocida; y y x son promedios obtenidos a traves de la mues- 
tra. 


Tambien se puede calcular al estimador del total poblacional, siendo igual a: Y = N y^. 

El coeficiente angular tanto para el promedio como para el total, se puede obtener por diferentes 
metodos, cuyos resultados obtenidos son iguales: 

^ _ X Z x Z y _ X(x. —X )(y z — y ) ^ m xy _ Covarianza 

XZ 2 X(x - x ) 2 S 2 VarianzadeX 

x v i 7 x 


m 




n 


— X y (Covarianza) 


Siendo: 


2 _ lx} - yjx 2 
S x n 

(Varianza de la variable) 


Tambien se puede calcular b directamente 

b = nlx.y. -(Ix)(Ly) h _ ~ nx y 

rilx? - CLxf ° Ixf - nx 2 

En aquellas ecuaciones donde sea necesario calcular el coeficiente de posicion C, para la estimacion 
del promedio se podra obtener por cualquiera de las siguientes formulas: 

_ - - , Xv. - blx l 

c = y - x b c = —^- 1 

J n 

Tambien los valores de b y c se podran hallar por el metodo de os mmimos cuadrados , para ello se 
utilizara un sistema de ecuaciones normales: 


(1) Xyi = nc + bl< . (2) X . . = cX . + bl 2 

En las estimaciones de totales, el coeficiente de posicion C sera igual al producto del tamano pobla¬ 
cional por el coeficiente de posicion en la estimacion del promedio: (N c) 

Veamos la aplicacion de estas formulas con los datos obtenidos a traves de la encuesta por mues- 
treo, realizada en una poblacion de 355 familias y cuyo tamano muestral se calculo en 28. 
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Ejemplo: 


Supongamos que se va a estimar el consumo promedio de came (Y), en relacion a los niveles de ingreso 
(x) de las familias. 


X 

i 

y< 

2.700 

812 

1,920 

630 

880 

510 

860 

506 

1.840 

620 

1.860 

716 

1.260 

520 

2.060 

780 

1.700 

895 

960 

520 

1.890 

576 

1.110 

620 

1.980 

586 

1.790 

760 


Continua 


X 

i 

y t 

1.000 

650 

1.520 

666 

3.460 

718 

950 

515 

980 

560 

1.950 

710 

960 

782 

1.640 

720 

1.760 

543 

2.820 

742 

1.880 

560 

2.060 

616 

1.450 

580 

1.010 

630 


lx, = 46.250 
Zy, = 18.043 
I x.y, = 30.686.590 
Zx, 2 = 87.416.300 
Zy? = 11.923.031 
77 = 28 


X 


y 


46,250 

28 


1.651,78 


18,043 

28 


= 644.39 


Un primer metodo de calculo de los coeficientes de regresion, seria trabajando con un sistema de 
ecuaciones normales : 




Reemplazando: 

(1) 

Zy. = nc + bZx 

(1) 18.043 = 28c+ 46.250Z) 

(2) 

Ijcy. = cZx. + bZx 2 . 

(2) 30.686.590 = 46.250c + 87.416.300Z) 


Multiplicamos la segunda ecuacion por 28 y a la primera por 46.250 para eliminar C: 


(2) 859.224.520 = 1.295.000c + 2.447.656.4006 

(1) - 834.488.750 =- 1.295.000c-2.139.062.5006 

24.735.770 = 0 308.593.900 £ 

b - 24 - 735 - 770 =0,080156 = 0,0802 
308.593.900 

Ahora reemplazamos en la ecuacion (1) 


(1) 18.043 = 28c + 46.250 (0,0802) 

c = 18.04o - 46.250 (0,0802) _ ^ j 1^9196 = 511,92 
28 

Otros procedimientos de calculo 

- (Sx,)(S yi ) 28(30.686.590)-(46.250)(18.043) = Q 0g02 ( } 

77Lx^-(Lx,) 2 28(87.416.300) - (46.250) 2 
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tambien: 


b = 


^ ~ nx y => b = 


Zx? - nx 2 


30.686.590 - 28(1.651,79)(644,39) 
87.416.300-28(1.651,79) 2 

0,0802 (aprox.) 


b =-&pr- co\ = ^y±-xy => cov = 30686590 - (1.651,79)(644,39) : 
n 28 


= 31.552,68 (aprox.) 


S ^ s]= 87.416.300 - 28(1.651,79)^ 3 , 

28 


S: _^yf-ny 2 _ c2 11.923.031-28(644,39) 2 
y ~ ~ ^ b — — 

28 


n 


10.584,06 


Siendo Y = bx+c => Y= 0,0802(1.700) + 511,92 = 648,26 (gramos de consumo 

de carne) 

Tambien: Y = b(x~x)+y => Y= 0,0802(1.700-1.652)+ 644,39 = 648,24 grs. 


Para fijar los limites de confianza del 95%, se debe calcular la Varianza residual : 


Y=y EL ±^ 


i -/ 


s ; (1 - O 


Y 


648,26 + 2,052 


Fi 28 -I 

r 

i 355 

10.584,06(1-0,24) 

U 28 

■ 


Y = 648,26+ 33,38 




681,64 gramos 
614,88 gramos 


El resultado de 648,26 gramos debe ser el consumo promedio de came diaria, para familias con 
ingresos de $1,700 (miles) 


El coeficiente de correlation al cuadrado o coeficiente de determination de Pearson (R 2 ) 6 (r 2 ), se 
calcula asi: 

r 2 [wUry. - (Sr-XI#)] 2 
[ W Zr 2 -(Zx,) 2 ][ W ZTf-(Zj; ! ) 2 ] 

r 2 = _ [28(30,686,590) - (46.250)(18,043)f = Q24 

[28(87.416.300) - (46.250) 2 ] [28(11.923.031) - (18.043) 2 ] 
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Tambien se puede obtener aplicando la siguiente formula: 

r 2 =R2= ™vi ^ j2 = (31.547,32) 2 

S 2 S 2 (393.613,72)(10.584,06) 


Algo similar ocurre con el calculo de los limites de confianza, cuando se requiere calcular el valor 
de la Varianza residual 


Y = J BL 


±t. 




1 -« 
N 



Zv 2 - cZv. - blxy 

S l Si iS I 

n 


o s y l = s y 2 -2cov(b) + b 2 s 2 x 


Todos estos resultados se obtienen directamente con las calculadoras que tengan el programa LR 
(Regresion Lineal) o aplicando el programa EXCEL. Sin embargo, los resultados difieren un poco gene- 
ralmente por los decimales, cuando utilizamos algunas formulas que son comunes en el muestreo, tales 
como: 


2 Xx 2 - nx 2 X(x. -x) 2 

_ 2 _ Yy]-ny 2 _ ZO,-^) 2 

n — 1 n — 1 

y n - 1 n - 1 


s;= 408.178,31 s; = 10.976,07 

La varianza residual muchos la calculan dividiendo por n - 2 es decir: 


2 tyj- C ^y, ~ blx t y. 

S y x _ n - 2 

Lo anterior hace que los calculos que hicimos varien, dependiendo de las correcciones que utilice- 
mos, su aplicacion dependera del criterio que tenga la persona que realiza la investigacion. 

Si usted requiere estimar el total de consumo de came diaria (en gramos) para las 355 familias, se 
hara una pequena modificacion, sabemos que: 

j, 242.396,69 

Y = 355(648,26) ± 2,062(355)^280,71 = 230.132,3 ± 12.264,39 ^ 

217.867,91 

ESTIMACION DE PROMEDIOS, PROPORCIONES Y TOTALES EN 
DOMINIO DE ESTUDIO 

Tal como se menciono anteriormente, el dominio de estudio , se presenta por un mal diseno de la 
muestra o por errores en el analisis 
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Recordemos algunos estimativos de proporciones, promedios y totales, con la informacion obtenida 
en la muestra de 28 familias, tomada de la poblacion de 355 familias. El grupo o dominio a analizar son 
las familias propietarias de vivienda, sin tener en cuenta el ingreso de aquellas que no son propietarias, 
el cual se constituye en error al hacer el analisis. Los datos para esta condicion son los siguientes: 

Ejemplo 1: 


NUMERO 

DE ORDEN 

NUMERO 

ALEATORIO 

INGRESOS 
(miles $) 

NUMERO DE PERSONAS 

CONSUMO 

DIARIO DE 
CARNE gr. 

Total 

M 

F 

Traba- 

jando 

i 

170 

2.700 

3 

1 

2 

2 

812 

2 

045 

1.920 

2 

1 

1 

2 

630 

o 

J 

111 

860 

5 

2 

o 

J 

1 

506 

4 

132 

1.260 

3 

2 

1 

1 

520 

5 

087 

2.060 

5 

1 

4 

2 

780 

6 

111 

1.110 

3 

1 

2 

2 

620 

7 

248 

1.980 

3 

1 

2 

2 

586 

8 

303 

3.460 

4 

1 

o 

o 

J 

718 

9 

230 

980 

2 

1 

1 

1 

560 

10 

286 

1.950 

5 

1 

4 

2 

710 

11 

032 

960 

2 

1 

1 

1 

732 

12 

318 

1.760 

2 

1 

1 

1 

543 


Se pide establecer los limites de confianza del 95% para los siguientes estimadores: 

a) Ingreso promedio de las familias propietarias de vivienda. 

b) Ingreso total de propietarios, si se sabe que existen 173 familias en el barrio investigado. 

c) Ingreso total de propietarios, si no se conoce el numero de estos en la poblacion. 

d) El promedio de personas correspondiente a familias propietarias de vivienda. 

e) El total de personas en las familias poseedoras de vivienda, si no se conoce el numero de 
propietarios en la poblacion. 

f) El porcentaje de familias propietarias de vivienda y consumo diario de carne superior a 600 
gramos. 

Solucion: 


a) Ingreso promedio de las familias propietarias: 
_ Ex. 21.000 


x= - 


12 


= 1.750 


S = 


Xx 2 - nx 2 
n -1 


i 


43.453.400- 12(1.750) 2 = 7g0 64 


12-1 


Si la confianza es del 95% se tendra que t = 2,201. 


x= x±tj={TJ 
, w 


/■ YL Como no conocemos el numero de familias propietarias de vivienda, se tendra como 
^ fraccion de muestreo : /= ^ = 28/355 = 0,079 
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X s = 1.750±2,201 ^-0 079 

! v 12 


X s =1.750 + 476,00 




2.226,00 = $2,226,000 


! ^ 1.274,00 = $ 1.274.000 

b) Ingreso total de lasfamilias propietarias, sabiendo que en la poblacion hay 173 familias. 

TV; = 173 


1 = N 1 x±t^{JZf 

i V«i 


n 1 = 12 


f 


N, 


X = 173(1.750) ±2,201 


173(780,64) 

{n 


12 

173 J 


y 3 


85.528,24 


X = 302.750 ±82.778,24 Q (miles de $) 

^*219.971,76 

c) Total de ingreso s de lasfamilias propietarias , cuando no se conocen las familias propietarias en 
la poblacion. 

En este caso, no puede ser utilizado N = 355, ya que el valor representa la totalidad de familias pro¬ 
pietarias y no propietarias. Para determinar el total de ingresos se debe proceder de la siguiente manera: 


/x __/Lx.\ /21 000\ 

X = U = 355 2g = 266.250 (miles de $) 




Lx. = Suma de los ingresos de las familias propietarias de vivienda, en la muestra (n= 12) 
En el calculo de la varianza, se sigue un proceso similar al utilizado para el total. 

43 . 453 . 400-28 


Ex - - nx~ 


1.026.051,85 


n -1 28-1 

S = V 1.026.051,85 = 1.012,94 

Los limites de confianza del 95% para estimado del total seran: 


N\ 

J 

\ n J 


X = N' 


V =n- 1 =28- 1 
a = 0,05 


Ex 2 -i 


Ex V 
V n / 


n - 1 




N 


} t = 2,048 


V 355 (Tr) ± * 


048 


355(1,012,94) 

V28~ 


1 - 


28 


705 


355 
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X = 266.250±133.574,24 . 

1 Ni 


399.824,24 


(miles de $) 


132.675,76 

Seria mas facil el procedimiento, si primero estimamos el total de familias propietarias, asi: 
Proporcion de propietarios = 12/28 = 0,4286; luego, el numero de total de propietarios 
N = 0,4286(355) = 152 (Total propietarios de vivienda) 


X= Nx ±tN , l-£ 




X= 152(1.750)±2,201(152) -^==4 J j_ 12 


VlT 


152 


, * 338.354,58 

X = 266.000 ± 72.354,58 ± (miles de $) 

^ 193.645,42 

d) Promedio de personas de familias propietarias de vivienda. 


La media aritmetica : % = ^ x r 

n 

La desviacion tipica o estandar: 
s = 


39 

*=12 = 3 ’ 25 


lx 2 - nx " 


« - 1 


143 - 12(3,25) 2 = l 22 


12-1 


Los limites de confianza del 95% 


v=n- 1 = 12-1 = 11 
a = 0,05 


t = 2,201 


x = x +?± Vk / 7 

7 yn 




>. 3,99 

: 3,25 ±0,74 ± (Personas 

\ por familia ) 


e) Para estimar el total de personas, en las familias propietarias de vivienda , se presentan dos 
situaciones; en primer lugar, cuando se conoce el numero de familias propietarias ( ]N 1 = 173). 


±= Nx ±tN]j= Jl-f 

, - j* 691,61 =692 

X- 173 ( 3 , 25 ) 12 , 201 ( 173 ) 4 ^ J 1 = 562,25 ±129,36 ^ 

l' 3 ^ 432,89=433 

Numero de personas en las familias 
propietarias de vivienda. 


ar 


En segundo lugar, lo que mas interesa, cuando no se conoce el numero de propietarios, es decir, 
cuando el tamano poblacional del subgrupo o dominio estudiado es desconocido. 
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1 r 355 (-^-) ±2 ’ 048<355) 7f f~M 


X =494,46 ±238,68 




s = 


143 — 28(39/28) 2 
28-1 


733,14 
225,78 
= 1,81 


(733) 

Personas 

(256) 


f) En cuanto hace referencia al numero defamilias propietarias, con un consumo diario de carne 
superior a los 600 gramos , en la muestra (Tl = 12) encontramos 6 familias. Si, en primer lugar, 
consideramos las 173 familias propietarias de vivienda, se tendra: 



A 



±2,201(173) 



141,88 = 142 
31,12 =31 


Familias 


Cuando no se conoce el numero de familias propietarias de vivienda, en la estimacion de una pro- 
porcion, se procede exactamente igual al del promedio. 

A = Np = N (—^) = 355 ( 4 -) = 76 ’ 07 

S p = (m = J(4)(i|) = (0,21)(0,79) = 0,407 

1= N P ±tN 


A =355 

5 



±2,048(355) 


(0,21X0,79) [Tj2 
28-1 1 173 


6 


131,05 = 131 

A= 76,07 ±54,98 ^ j-fanulias 

' 21,09 = 21 J 


El estimadorpuntual, cuando se conoce la poblacion del subgrupo, sera 87 familias de las 173, cuyo 
consumo de came diario es superior a los 600 grs. 

Cuando no se conoce la poblacion del subgmpo (dominio), el numero de familias, con dicho con¬ 
sumo se estima en 76 familias. 
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EJERCICIOS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


27. El censo de establecimientos comerciales realizado en un pais, revelo que habia 3.720 clasificados 
como medianos. De esa poblacion se tomo una muestra aleatoria de 30, obteniendose la siguiente 
informacion: 


Na 

PERSONAL 

EMPLEADO 

SEXO 

VENTA 
SEMANAL 
(Millones $) 

PROPIEDAD 

LOCAL 

ACTIVIDAD 

COMERCIAL 

PERSONAL 
AFILIAD0 
ALSEGURO 

H 

M 

1 

4 

2 

2 

37,8 

si 

alm.telas 

3 

2 

2 

2 

0 

22,3 

no 

fama* 

0 

3 

3 

1 

2 

28,4 

si 

tienda 

1 

4 

5 

2 

3 

49,6 

no 

almacen 

5 

5 

2 

0 

2 

19,6 

no 

tienda 

0 

6 

3 

0 

3 

27,4 

si 

tienda 

1 

7 

6 

2 

4 

42,6 

si 

panaderia 

4 

8 

8 

2 

6 

51,4 

no 

almacen 

6 

9 

2 

2 

0 

23,6 

no 

tienda 

0 

10 

5 

3 

2 

42,5 

si 

tienda 

3 

11 

6 

3 

3 

51,4 

no 

almacen 

5 

12 

2 

1 

1 

30,6 

no 

tienda 

0 

13 

4 

2 

2 

34,5 

si 

papeleria 

2 

14 

6 

2 

4 

48,6 

si 

almacen 

4 

15 

3 

1 

2 

31,4 

no 

tienda 

1 

16 

2 

0 

2 

18,6 

no 

drogueria 

0 

17 

2 

1 

1 

19,7 

si 

fama* 

2 

18 

3 

1 

2 

27,6 

si 

licores 

0 

19 

4 

1 

3 

38,4 

si 

tienda 

0 

20 

2 

2 

0 

19,3 

no 

tienda 

1 

21 

4 

1 

3 

41,4 

no 

almacen 

3 

22 

6 

2 

4 

53,6 

si 

almacen 

3 

23 

2 

1 

1 

42,5 

si 

tienda 

2 

24 

3 

2 

1 

20,6 

si 

licores 

3 

25 

2 

0 

2 

32,8 

si 

tienda 

0 

26 

3 

1 

2 

31,6 

no 

drogueria 

0 

27 

4 

1 

3 

42,5 

si 

papeleria 

2 

28 

5 

2 

3 

53,4 

no 

almacen 

4 

29 

2 

1 

1 

23,6 

si 

fama* 

2 

30 

3 

2 

1 

32,5 

no 

tienda 

2 


* Venta de carne. 

Estimar el total de ventas semanales (miles de $) por empleado en los establecimientos cuya 
actividad aparece como almacen. 


28. Con los datos del ejercicio 27, estimar la proporcion y total de establecimientos que aparecen con 
actividad comercial TIENDAy que sus gestores sean propietarios del local. 


29. Con los datos del ejercicio 27, estimar el total de hombres que trabajan en los establecimientos 
comerciales que funcionan en locales propios. 


30. Con los datos del ejercicio 27, estimar el promedio y el total de ventas en millones de pesos por 
empleado. 


31. Con los datos del ejercicio 27, estimar la proporcion y el total de personas afiliadas al seguro de 
salud y pension. 
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32. Con los datos del ejercicio 27, estimar el promedio y el total de mujeres empleadas en los 
establecimientos comerciales. 

33. Mediante la Regresion lineal, con los datos del ejercicio 27, estimar el promedio y el total de ventas 
semanales por empleado, sabiendo que el promedio de empleados por establecimiento es de 3,8 
(X= 3,8), fijando limites del 95%. 

34. Estimar el total de ventas semanales (millones de $), para los establecimientos que tienen como 
actividad comercial TIENDA, fijando limites del 95%. 

35. De acuerdo al censo levantado en 2011 en una ciudad del pais, se revelo que existian aproximadamente 
15.000 viviendas. De esta poblacion se tomo una muestra aleatoria de 35 viviendas, obteniendose 
informacion relativa a la clasificacion segun: a) propiedad de la vivienda; b) numero de personas 
clasificadas por sexo; c) que hayan ido o no al medico durante el ultimo ano; d) que hayan ido o 
no al odontologo durante el ultimo ano. La informacion es la siguiente: 


NO. DE 
ORDEN 

PROPIETARIO 

VIVIENDA 

NUMERO 

PERSONAS 

NUMERO 

VISITARON MEDICO 

VISIT. ODONTOLOGO 

Hombres 

Mujeres 

Si 

No 

Si 

No 

1 

si 

5 

1 

4 

5 

0 

1 

4 

2 

no 

6 

3 

3 

0 

6 

0 

6 

3 

si 

3 

1 

2 

1 

2 

1 

2 

4 

si 

3 

1 

2 

3 

0 

2 

1 

5 

si 

2 

1 

1 

0 

2 

0 

2 

6 

no 

3 

1 

2 

0 

3 

0 

3 

7 

si 

3 

1 

2 

0 

3 

1 

2 

8 

no 

3 

1 

2 

0 

3 

1 

2 

9 

no 

4 

2 

2 

0 

4 

1 

3 

10 

no 

4 

3 

1 

0 

4 

0 

4 

11 

si 

3 

2 

1 

2 

1 

1 

2 

12 

no 

2 

1 

1 

0 

2 

0 

2 

13 

no 

7 

3 

4 

4 

3 

2 

5 

14 

si 

4 

3 

1 

4 

0 

1 

3 

15 

no 

3 

2 

1 

1 

2 

0 

3 

16 

si 

4 

3 

1 

4 

0 

1 

3 

17 

no 

4 

1 

3 

0 

4 

4 

0 

18 

n o 

4 

1 

3 

2 

2 

1 

3 

19 

no 

3 

2 

1 

1 

2 

1 

2 

20 

no 

3 

1 

2 

3 

0 

0 

3 

21 

si 

4 

1 

3 

4 

0 

1 

3 

22 

no 

3 

2 

1 

0 

3 

0 

3 

23 

si 

3 

1 

2 

0 

3 

1 

2 

24 

no 

1 

0 

1 

0 

1 

0 

1 

25 

no 

2 

1 

1 

2 

0 

2 

0 

26 

si 

4 

2 

2 

2 

2 

1 

3 

27 

si 

3 

1 

2 

1 

2 

1 

2 

28 

si 

4 

3 

1 

2 

2 

1 

3 

29 

no 

2 

0 

2 

1 

1 

0 

2 

30 

no 

4 

2 

2 

1 

3 

2 

2 

31 

si 

3 

1 

2 

2 

1 

0 

3 

32 

no 

5 

4 

1 

3 

2 

3 

2 

33 

si 

1 

1 

0 

0 

1 

1 

0 

34 

si 

2 

0 

2 

0 

2 

1 

1 

35 

no 

3 

3 

0 

1 

2 

2 

1 

£ 

- 

117 

56 

61 

49 

70 

34 

83 
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Se pide calcular los estimados puntuales y fijar limites de confianza del 95%. 

a) Proporcion de mujeres. 

b) Promedio de personas. 

c) Total de propietarios de vivienda. 

d) Numero de personas que visitan al odontologo. 

36. Con los datos del ejercicio 35, estimar: 

a) Razon entre las personas que visitan al medico (y.) y aquellos que visitan al odontologo. (x) 

b) Proporcion de personas que visitan al medico. 

c) Proporcion de personas que visitan al odontologo. 

37. Se realiza una muestra de 10 fusibles, de una cierta marca, para determinar el punto medio de 
ruptura. Los puntos medios en amperios fueron: 


24 

18 

14 

26 

20 

22 

19 

22 

17 

20 


a) Determine el estimador puntual. 

b) En el punto (a), fije los limites de confianza del 95%. 

c) Al nivel del 1%, ^podria afirmarse que estos resultados son inferiores a los senalados por la 
empresa, de 22 amperios el punto medio de ruptura? 

d) Si la poblacion de fusibles esta constituida por 5.000 unidades, sabiendo que su promedio de 
ruptura es de 20 amperios. ^que tipo de error se comete? 

38. De la zona de una ciudad con 10.000 familias, se extrajo una muestra aleatoria de 40. El numero de 
personas registradas por familia en la muestra es de: 


4 

2 

4 

3 

3 

4 

7 

2 

4 

2 

1 

3 

3 

4 

3 

3 

4 

4 

6 

5 

3 

4 

4 

3 

3 

3 

2 

3 

6 

5 

3 

3 

4 

5 

6 

3 

2 

2 

1 

4 


a) Hacer la estimacion puntual para el total de personas. 

b) Calcular la probabilidad de que dicha estimacion este comprendida dentro de ± 10% del valor 
verdadero (Nota: se pide el valor de Z). 

c) Resolver los puntos a) y b) elaborando una tabla de frecuencias (variable discreta). 

39. Al efectuar el inventario de un almacen, se pretende aplicar el muestreo para reducir el trabajo; 
por tal motivo se contabiliza el valor de los articulos de cada uno de los 36 estantes (N = 36) que 
tiene el local. Se sabe que la varianza poblacional (a 2 ) es aproximadamente 134,53. Ademas la 
estimacion del valor total obtenido a partir de una muestra debe ser correcta dentro de ±2, con una 
confianza del 95% . Un asesor sostiene que una muestra aleatoria simple de 12 (n) estantes satisface 
los requerimientos. ^Esta de acuerdo con esta estimacion? 

40. Una universidad tiene 7.000 estudiantes matriculados, de los cuales se selecciona una muestra de 
700; 480 de ellos menores de 20 anos. Obtenga el estimado puntual del total de estudiantes menores 
de 20 anos y luego fije los limites de confianza del 99%. 

41. Se tiene la siguiente poblacion de 20 valores 

Y. = 6835 10 6 12 8672687 10 12 5824 


Information adicional: E Y = 135 EE 2 = 1.069 

a) Determine el tamano de la muestra, si se desea un error de 2 y una confianza del 95%. 
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b) Utilizando la calculadora o la tabla de numeros aleatorios, seleccione una muestra de acuerdo al 
tamano anterior y estime tanto el promedio como el total, fijando limites de confianza del 95%, 
en un muestreo aleatorio simple. 

42. De una lista de 468 colegios se selecciono una muestra aleatoria simple de 100, de los cuales 
resultaron 54 publicos y 46 privados. La siguiente es la informacion obtenida de los colegios de 
la muestra donde Y y X se refieren respectivamente, a un numero de estudiantes y numero de 
profesores. 


COLEGIOS 

n 

y t 

V 

V. 

i 

X 2 

x ,y, 

Publicos 

54 

31.281 

29.881.219 

2.024 

111.090 

1.729.349 

Privados 

46 

13.707 

6.366.785 

1.075 

33.119 

431.041 


Se pide, en cada tipo de colegio, estimar la razon entre el numero de estudiantes y el numero de 
profesores, estableciendo limites de confianza del 95%. 


43. De una lista de 10.000 empleados se obtuvo una M.A.S. de 300, de los cuales 120 demostraron no 
tener aptitudes para ser promotores de ventas, Determine la proporcion y el total de empleados que 
tiene aptitudes de promotores de ventas y establezca el intervalo de confianza del 90%. 

44. Una asociacion de odontologos, realizo una investigacion relativa a las piezas dentarias a 300 ninos 
de cierto pueblo. Se selecciono una muestra aleatoria simple de 40 ninos, para determinar el numero 
de piezas cariadas en cada nino. Los resultados fueron: 



a) Estime el total de piezas cariadas en los ninos del pueblo. 

b) La proporcion de ninas sin piezas cariadas. 

c) El total de ninos (varones) con piezas cariadas. 

45. Con los resultados del ejercicio 44 se pide: 

a) En las tres caracteristicas anteriores, fije limites de confianza del 99%. 

b) Considere que la muestra de 40 ninos, se realizo como encuesta preliminar (piloto) y determine 
los tamanos muestrales para el promedio de piezas cariadas por nino, con un error de ± 2, y la 
proporcion de ninos (varones) sin caries, con un error del 8%. En ambos casos la confianza es 
del 95%. 

46. En cuatro barrios de la ciudad, conformados por 48 manzanas, se eligieron aleatoriamente 20 
familias. A cada familia seleccionada, se le pregunto por el numero de miembros y posesion de 
vehiculo. Las respuestas fueron: 
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N = 2.000 familias y. = Numero de personas por familia x. = Numero de vehiculos 
Se pide: 

a) Fijar limites de confianza del 95% para la estimacion del numero de personas por vehiculo, 
siendo X = 2. 

b) Si el numero de vehiculos particulares en esos cuatro barrios es de 3.500, ^sera igual el total de 
personas en dicha zona? 

c) ^Cual es el promedio estimado de personas por familia? 

47. Con la siguiente informacion, correspondiente a una encuesta realizada a un grupo de 25 empleados, 
mediante el muestreo aleatorio simple, en una empresa importadora, sobre niveles de ingresos y 
gastos semanales en alimentacion (miles de $), se pide estimar la razon entre ingresos y gastos 
semanales con una confianza del 99%. 

IX. = 405 Ey.= 183 Ex 2 = 22.687 A=300 2y. 2 = 4.157 LX.y = 9.612 

i s i i s i is i 

48. Un empresario se propone probar la hipotesis de que las normas de llenado en botellas de un litro, 
de cierta marca de aceite, tiene como media 30 cm 3 . La muestra examinada revela las siguientes 
normas (cm 3 ): 


20 

25 

35 

25 

5 

30 

20 

40 

15 

35 

20 

25 


a) Establezca el intervalo de confianza del 95% de la media obtenida. 

b) ^Es correcta la hipotesis del investigador, a un nivel de significacion del 5%? 

c) Si la media (verdadera) de norma es de 28 cm 3 , ^que tipo de error se comete? 


49. Se ha medido el contenido de nicotina de 36 cigarrillos de una determinada marca. A continuacion 
se resumen los resultados: 

x i = Contenido de nicotina de un cigarrillo, medido en miligramos 
x = 576 miligramos Z(r — = 315 miligramos 

Obtenga un intervalo de confianza del 99%, para estimar el contenido promedio de nicotina. 

50. En una zona residencial con 3.000 viviendas se requiere estimar el porcentaje de habitadas por: a) 
su propietario; b) familias que poseen dos automoviles. Se desea que los errores de muestreo de 
esos porcentajes estimados no superen el 2% y 1% respectivamente. Se presume que el porcentaje 
de propietarios de vivienda en dicha zona debe estar entre el 45 y el 65% y el de propietarios de 
automoviles entre el 5 y 10%. ^Que tamano de muestra se requiere, para lograr ambos propositos? 


51. En un barrio de la ciudad viven 150 familias. Una muestra aleatoria de 15 familias suministra 
informacion relativa al ingreso familiar mensual y a su condicion de propietarios o arrendatarios de 
vivienda. 


FAMILIAS 

INGRESOS 

(millones de $) 

PROPIETARIOS 

1 

5,0 

si 

2 

3,5 

si 

3 

4,0 

si 

4 

2,5 

no 


Continua... 
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5 

3,5 

si 

6 

4,0 

si 

7 

2,0 

no 

8 

2,5 

no 

9 

1,5 

no 

10 

3,0 

no 

11 

4,2 

si 

12 

2,8 

no 

13 

3,6 

si 

14 

1,8 

no 

15 

__ 

no 


En cada uno de los siguientes casos obtener el estimador puntual y fijar limites de confianza del 95%. 

a) Ingreso promedio de las familias del barrio. 

b) Ingreso total de las familias del barrio 

c) Ingreso promedio de los propietarios. 

52. Con los datos del ejercicio 51 se pide calcular: 

a) Ingreso total de los propietarios, si se sabe que existen 50 propietarios. 

b) Ingreso total de los propietarios, si no se dispone de la informacion del numero de propietarios. 

c) Porcentaje de arrendatarios. 

53. Con los datos del ejercicio 51 se pide calcular: 

a) Numero de arrendatarios. 

b) Porcentaje de arrendatarios con ingresos superiores a 2,5 (mill, de $) 

c) Numero de arrendatarios con ingresos superiores a 2,5 (mill, de $) 

d) Porcentaje de familias con ingresos superiores a 3,7 (mill, de $). 

54. Se realizo una encuesta a cierto grupo de personas para estimar el ingreso total del grupo y el 
ingreso promedio (miles de $) de las personas. Se uso una estimacion por el metodo de la razon con 
viariable auxiliarX. (ingreso de hace 5 anos). Los datos son: 


X 

i 

900 

800 

600 

500 

500 

800 

600 

y, : 

2.500 

2.000 

2.700 

1.800 

3.000 

2.500 

2.000 


X = 210.000 N = 400 


Se pide estimar Y; Y y R fijando limites del 95% para los estimadores. 

55. Se realiza una encuesta a 17 familias en cuanto a: tamano, ingreso mensual, gastos en alimentos 
quincenal (incluyendo servicios), y si tienen suscripcion a algun periodico de la ciudad. Los 
resultados fueron: 


FAMILIAS 

NUMERO DE 

PERSONAS 

INGRESOS 

(miles $) 

GASTOS EN ALIMENTOS 

INCLUIDOS SERVICIOS 

(miles $) 

SUSCRIPCION 

PERIODICO 

1 

2 

2.620 

820 

si 

2 

3 

1.840 

960 

no 

3 

3 

1.930 

1.010 

no 

_4_ 

_5_ 

_L450_ 

_760_ 

_no_ 
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5 

4 

2.620 

1.220 

si 

6 

7 

3.010 

1.130 

si 

7 

2 

2.420 

1.040 

no 

8 

4 

2.620 

1.230 

no 

9 

2 

2.210 

1.020 

si 

10 

5 

2.060 

1.020 

no 

11 

3 

2.420 

1.130 

no 

12 

6 

2.030 

840 

no 

13 

4 

1.860 

760 

si 

14 

4 

1.520 

780 

no 

15 

2 

1.790 

790 

no 

16 

5 

1.940 

830 

no 

17 

3 

2.820 

1.140 

si 


Se requiere estimar para una poblacion de 1.200 familias: 

a) Promedio de personas por familia. 

b) Gasto en alimentos por persona. 

c) Proporcion de familias con suscripcion al periodico 
(En todos los casos fijar limites de confianza del 95%) 


56. Se realiza una investigacion por muestreo en una industria, relacionando los puntajes de aptitud 
con la productividad despues de tres meses de entrenamiento del personal. Con los postulantes 
elegidos al azar se obtuvieron 10 pares de puntajes de aptitud y productividad, tal como se indica a 
continuacion: 


APTITUD 

9 

12 

17 

20 

18 

20 

24 

23 

20 

25 

PRODUCTIVIDAD : 

23 

28 

30 

32 

30 

36 

38 

32 

34 

36 


Se pide: - 

a) Estimar el promedio de productividad si consideramos x = 20, con limites del 95%. b) Estimar 
el total de productividad, con limites del 95%, sabiendo que N = 500, mediante la recta de 
regresion. c) Calcular el coeficiente de correlacion lineal. 

57. Con los siguientes datos obtenidos a traves de una muestra de 20 unidades, se obtuvo la siguiente 
informacion: 

IX. = 174 Ey. = 340 Ex 2 = 1.626 n = 20 Ey 2 = 5.904 Exy =3.062 

l «/ l l l W l 

A 

a) Estimar Y^, fijando limites de confianza del 90%, siendo x= 12 

b) Estimar fijando limites de confianza del 90%, siendo N = 300 

58. Los siguientes datos fueron obtenidos a traves de una encuesta por el metodo de muestreo aleatorio 
simple, cuyo tamano fue de 30. 



a) Estimar por el metodo indirecto de la regresion lineal (ponderada) el promedio para la variable 
Y, considerando x= 5,8. 

b) Estimar por el metodo indirecto de la regresion lineal (ponderada) el total para la variable Y, 
considerando N = 500. 
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59. Con la informacion del ejercicio No. 56 estimar R, Y R? Y R fijando limites de confianza del 90% 
considerando Y = Productividad y X = Aptitud. 

60. Hallar R, Y R? Y R y sus limites de confianza del 95% tomando la informacion de los ejercicios 57 
y 58. 

61. Suponga que el administrador de un pequeno negocio, mantiene en deposito 2.000 articulos y desea 
elaborar el inventario trimestral con el fin de preparar un informe (balance y estado de ingresos). 
Considera innecesario y dispendioso el conteo fisico de cada unidad para todos los 2.000 articulos y 
decide obtener una muestra de 30. De cada uno de los 30 articulos cuenta el numero de unidades en 
existencia y luego determina el costo por articulo, multiplicando el numero de unidades existentes 
por el costo unitario. Sus resultados fueron: 


ARTICULO : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

COSTO (miles $) : 

4.320 

800 

1.200 

3.650 

2.150 

300 

580 

7.200 

6.000 

5.100 

ARTICULO : 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

COSTO (miles $) : 

6.840 

1.150 

1.820 

1.200 

1.300 

840 

260 

380 

4.120 

6.150 

ARTICULO : 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

COSTO (miles $) : 

420 

1.100 

1.260 

840 

7.200 

640 

1.150 

2.100 

2.160 

480 


Estimar el costo total de los 2.000 articulos (inventario total) fijando limites del 95%. 


62. Un administrador considera que el costo del inventario anterior (ver ejercicio 61), correspondiente 
al 31 de marzo de 2010 esta correlacionado con el costo del inventario a 31 de diciembre de 2006. 
Para ello dispone de la informacion para los 30 articulos de acuerdo a los registros de inventario a 
31 de diciembre del 2011, asi: 


ARTICULO : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

COSTO (miles $) 

3.600 

960 

1.510 

2.150 

2.800 

1.000 

420 

360 

4.600 

4.800 

ARTICULO : 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

COSTO (miles $) : 

3.600 

960 

1.160 

1.000 

1.150 

920 

120 

240 

2.630 

6.240 

ARTICULO : 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

COSTO (miles $) : 

310 

860 

1.150 

920 

6.130 

480 

530 

1.620 

1.510 

210 


Si suponemos que el costo promedio (inventario a 31 de diciembre) fue de $2,728,6 miles. Se puede 
mediante la regresion, estimar el promedio del costo del inventario para el 31 de marzo de 2011 por 
articulo. Nivel de confianza, 95%. 


63. En una zona comercial de la ciudad se estudio el numero de personas que visitan a cada uno de los 
almacenes y cuantos de ellos compran, con lo cual se pudo determinar el valor promedio de compra 
por visitante. Con base en los resultados anteriores se desarrollo un programa de publicidad y 
presentacion de los articulos y atencion al visitante, posteriormente se volvio a calcular el promedio 
de ventas por visitante, concluyendo que el programa desarrollado fue eficaz. 

De acuerdo con el resultado anterior a la muestra, el numero de visitantes para estos almacenes fue: 
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ALMACEN : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

VISITANTES POR HORA : 

18 

26 

30 

41 

23 

42 

28 

31 

46 

42 

ALMACEN : 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

VISITANTES POR HORA : 

40 

36 

25 

28 

36 

35 

38 

42 

40 

39 


Ha pasado un determinado tiempo, desde el ultimo estudio, el cual no se volvio a realizar por ser 
demasiado costoso, obligando al diseno de una muestra aleatoria simple de 20 almacenes, para 
determinar el numero de visitantes por hora (en una semana de observacion), con el siguiente 
resultado: 


ALMACEN : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

VISITANTES POR HORA : 

21 

36 

42 

56 

28 

60 

34 

42 

58 

36 

ALMACEN : 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

VISITANTES POR HORA : 

48 

54 

36 

42 

63 

51 

70 

68 

56 

54 


Si el numero de visitantes (promedio) para los 2.000 almacenes (total) es de 37,6. Se pide estimar: 

a) El total de visitantes por hora, sin utilizar los datos de la segunda encuesta. 

b) El total de visitantes por hora, utilizando los datos de la segunda encuesta. Aplicar el metodo de 
la regresion. 

64. Con los datos del ejercicio anterior, se pide estimar: 

a) La proporcion de almacenes con un numero de visitantes por hora, superior a 50 personas. 
(Segunda encuesta). 

b) El total de almacenes que reciben a mas de 50 personas por hora. (Segunda encuesta). 

Nota: en cada uno de los estimadores fijar limites de confianza del 95%. 

65. En una ciudad cualquiera se ha determinado, que el numero de establecimientos comerciales es de 
9.200, con un maximo de 3 empleados por establecimiento. Se quiere saber si el local donde funciona 
es propio o arrendado y si tiene uso de banos exclusivo o se comparte con el de alguna vivienda 
vecina. Se investigaron 800 establecimientos de los cuales se obtuvo la siguiente informacion: 


CON BANO 

LOCAL PROPIO 

LOCAL ARRENDADO 

SI 

241 

409 

NO 

39 

111 


Con los anteriores datos se pide el estimador puntual y los limites de confianza del 95%, asi: 

a) Establecimientos con local arrendado, y el porcentaje con bano propio. 

b) Total de establecimientos en local arrendado y sin bano propio. 

c) Se sabe que el total de establecimientos con local arrendado es de 6.400, obtener una nueva 
estimacion del numero de ellos, con local y bano propio. 

66 . Con la siguiente muestra de 12 establecimientos comerciales pequenos (con menos de 8 
empleados): 


ESTABLECIMIENTO : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

No. EMPLEADOS : 

7 

6 

5 

4 

7 

6 

5 

4 

7 

7 

5 

4 
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EMPLEAD. CONMENOS 

DE 5 ANOS DE SERVICIO : 

3 

2 

3 

0 

2 

2 1 

3 

4 

3 

2 

3 

SALARIO PROMEDIO 
(miles de $) : 

664,8 

972,5 

870,6 

1.902,0 

1.830,0 

985,0 980,0 

774,6 

865,3 

768,4 

986,2 

848,0 


Sabiendo que el total de establecimientos en la poblacion es de 2.000 y se desea establecer limites 
de confianza del 95%, se pide estimar: 

a) El total de establecimientos con mas de 5 empleados. 

b) El total de empleados con mas o igual a 5 anos de servicio. 

67. Con los datos del ejercicio anterior se pide estimar: 

a) El total de salario que pagan los dos mil establecimientos. 

b) El salario promedio que debe pagar un establecimiento que tiene en promedio cinco empleados. 

68 . Un auditor detecta que cierta empresa regularmente exagera las cantidades (millones de $) 
de los inventarios, a causa de los registros en los retiros. El auditor quiere estimar la cantidad 
total exagerada sobre 1.000 articulos listados, obteniendo las cantidades exactas (revisadas) del 
inventario, mediante una muestra aleatoria simple de articulos. Comparando estas cifras exactas 
con las cantidades registradas obtenemos la exageracion (diferencia). Con los datos de la tabla 
siguiente, utilice el total de cantidad exagerada sobre los 1.000 tipos de articulos y establezca los 
limites de confianza del 95%. 


ARTICULO NO. : 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

CANT. REVISADA : 

1.750 

2.950 

680 

740 

1.280 

2.410 

3.620 

720 

590 

1.120 

1.180 

2.100 

2.400 

2.100 

CANT. REGISTRADA: 

2.100 

3.050 

910 

820 

1.400 

2.500 

3.840 

800 

820 

1.400 

1.240 

2.300 

2.600 

2.300 


69. Con la informacion del ejercicio No. 68, mediante la regresion lineal simple, estime la cantidad 
total registrada para los 1.000 tipos de articulos con base en un promedio de cantidad revisada de 
$1,500 millones, fijar limites de confianza del 95%. Para ello utilice la informacion del ejercicio 
anterior. 

70. Con los siguientes datos: 

Ex. = 1.031,7 Ex 2 = 106.818,03 N = 500 Ex.y .= 128.762,51 

E Yi = 1.250,6 Ey 2 = 156.749,88 n = 10 X = 105 

a) Estime mediante la razon (metodo indirecto) el promedio y total para Y. 

b) Estime mediante el metodo directo (promedio) el total para Y. 

71. Con los siguientes datos correspondientes a 28 familias sobre sus ingresos semanales, obtenidos a 
traves de una encuesta y un censo realizado con anterioridad: 

Informacion total y parcial de 28 familias. 
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NUMERO 

DE ORDEN 

NUMERO 

ALEATORIO 

INGRESO MENSUAL (miles $) 

CENSO X 

l 

MUESTRA y. 

1 

170 

1.640 

2.700 

2 

045 

1.310 

1.920 

3 

186 

520 

880 

4 

217 

580 

860 

5 

076 

1.230 

1.840 

6 

213 

1.320 

1.860 

7 

132 

840 

1.260 

8 

087 

1.390 

2.060 

9 

006 

1.200 

1.700 

10 

163 

760 

960 

11 

312 

1.450 

1.890 

12 

111 

730 

1.110 

13 

248 

1.420 

1.980 

14 

018 

1.160 

1.790 

15 

096 

750 

1.000 

16 

224 

920 

1.520 

17 

303 

2.140 

3.460 

18 

196 

720 

950 

19 

230 

660 

980 

20 

286 

1.440 

1.950 

21 

032 

680 

960 

22 

186 

1.250 

1.640 

23 

318 

1.160 

1.760 

24 

009 

2.400 

2.820 

25 

144 

1.400 

1.880 

26 

250 

1.350 

2.060 

27 

036 

1.060 

1.450 

28 

095 

730 

1.010 


XX 2 = Se pide: 

/n 

a) Estimar el valor de R y fijar los limites del 95% 

x\ 

b) Estimar el valor de Y R y fijar los limites del 95% 
b) Estimar el valor de Y R y fijar los limites del 95% 


MUESTREO ALEATORIO ESTRATIFICADO MAE 


El Muestreo Aleatorio Estratificado , denominado tambien muestreo aleatorio restringido , es un metodo 
que permite una seleccion mas eficiente que el obtenido mediante el muestreo aleatorio simple , en 
especial, cuando la caracteristica que se investiga es de gran variabilidad, lo cual, implica un tamano 
muestral relativamente grande, en comparacion al del muestreo aleatorio estratificado. 
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En una muestra aleatoria estratificada, la poblacion a investigar se divide en grupos relativamente 
homogeneos con relacion a la caracteristica en estudio. Estos grupos se denominan estratos , donde la 
unidad o el elemento investigado presenta una caracteristica tal, que solo le permite pertenecer a un estrato. 

Es necesario entender que un estrato es una subpoblacion y, como tal, cada uno se constituye en 
dominio de estudio. 

Los estratos pueden o no estar compuestos del mismo numero de unidades, por tal razon la fraccion 
de muestreo (f= n /N) puede variar de un estrato a otro. 

A1 conformar los estratos, lo primero que se debe considerar, siempre que sea posible, es la caracte¬ 
ristica de interes principal, que guarde relacion con los objetivos de la investigacion, para lo cual deben 
elaborarse estratos que generen la mayor homogeneidad posible. Las investigaciones de sondeo o las 
encuestas preliminares ayudan, no solo a identificar las caracteristicas de la poblacion, sino que permiten 
una buena estratificacion. 

En resumen, se puede decir que la estratificacion logra: 


□ Una mayor precision en los estimadores, a pesar de ser menor el numero de unidades 
seleccionadas, en comparacion al muestreo aleatorio simple. 

□ Garantizar la representatividad y una reduccion del error de la muestra, por agrupacion 
de aquellos elementos que se parecen mas por la caracteristica que se investiga, que por 
pertenecer a la poblacion. 

□ Las caracteristicas de la poblacion total quedan representadas; ademas, los errores de 
muestreo que resultan de una muestra aleatoria simple, seran may ores que los de la muestra 
aleatoria estratificada del mismo tamano. 

□ Allegar informacion detallada para un grupo o estrato especifico, ya que se logra una 
muestra independiente de los demas estratos. De cada uno se obtienen promedios y 
varianzas separados y mediante la ponderacion, se calcula el valor del estimador del 
promedio y de la varianza. 

□ Dividir la poblacion en grupos o estratos mas o menos homogeneos en cuanto a su 
composicion interna, pero heterogeneos si se comparan los estratos entre si. 

□ Ventajas administrativas. 


Un plan de estratificacion es optimo, cuando se minimiza la desviacion estandar del estrato. Mien- 
tras mas estratos se establezcan, tanto mas homogeneos seran. Sin embargo, para algunos autores, hay 
incrementos en los costos en consideracion al numero de elementos que conlleva la muestra en cada 
estrato. Por otra parte, la estratificacion sera efectiva, dependiendo de la estrecha relacion que guarden 
los factores de estratificacion con las caracteristicas que se investigan. 

Las estimaciones podran ser mas precisas en la medida del tamano de la muestra por estrato y, en 
especial, por la forma en que se realiza la seleccion de las unidades de la muestra en cada uno de ellos. 
Para su calculo, se utilizan varios metodos: 
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□ Muestras de igual tamaho , denominada tambien afijacion igual , consistiendo en 
seleccionar el mismo numero de unidades para cada estrato muestral. 

□ Muestras de asignacion o afijacion proportional, donde los tamanos muestrales en 
cada estrato, tendran un numero de unidades en forma proporcional a las de los estratos 
poblacionales. 

□ Muestras de asignacion o afijacion optima , cuyo tamano estara determinado teniendo en 
cuenta los costos y el grado de variabilidad, en tal forma que el error de estimacion sea 
minimo para un costo total dado. 


Simbologia 

En el Muestreo Aleatorio Estratificado se utilizan simbolos especiales tanto para la poblacion, como para 
la muestra. 

N = Total de unidades que constituyen la poblacion objetivo. 

N h = Total de unidades que contiene cada estrato poblacional. 
h = Identifica el estrato, donde h toma valores de 1 2 3 hasta L estratos. 

Nj N 2 N 3 etc., seran los tamanos poblacionales en los estratos 12 3 etc. 

m = N = N, + Af + Af + ...N t =N 

h 12 3 L 

Y, = Media aritmetica poblacional para cada estrato 



Y, = 


gx/■• 



y 3 = 


*3 


Y s , = Media aritmetica poblacional estratificada ponderada. 


Y _ 

* N 


Y„ = 2Y*W* 


w* 


w = 


Proporcion de elementos en cada estrato 

N, 


Nh_ 

N 


W = 
w i n 


N? 

w = — 

2 N 


W 3 = 


Ns_ 

N 


EW h = Wi +W 2 +W 2 + ...Wl= 1 


, ZYpNJl 

h N h - 1 


= Wianza poblacional en cada estrato 






















CAPITULOTRECE 

ALGUNOS METODOS DE MUESTREO 


721 


n = Numero de unidades que contiene la muestra total. 

n h = Numero de unidades que contiene la muestra en cada estrato muestral. 

= n = n 1 + n 2 + n 3 + ... 

y h = Media aritmetica muestral para cada estrato. 


_ = 'Ey M 

y>i n 


=> yi = 


Sy n 


- Sy 2i 

y2=-^~ 


y , = Media aritmetica muestral estratificada. 

S St 


y 3 = 


Syr.- 

n 3 


— _ 

y st jY 


o 


y st = JLy h Wh 


= Vhrianza muestral en cada estrato 

Dependiendo de la manera como se distribuyen los elementos dentro de los estratos maestrales, se 
ha dicho que se consideren tres metodos, los que seran tratados en forma independiente. 

a) Asignacion o afijacion igual; 

b) Asignacion o afijacion proporcional 

c) Asignacion o afijacion optima. 



ASIGNACION IGUAL 

Se ha dicho que este metodo implica, que los tamanos muestrales en cada estrato deben ser iguales. 
n x = n 2 = n y .. etc. 

Antes de determinar el tamano de la muestra, estratificamos la poblacion de las 355 familias que, 
hasta ahora, se ha venido analizando. 

En primer lugar, se hace necesario identificar la caracteristica principal que se tendra en cuenta 
al conformar los grupos o estratos, en este caso, seran los ingresos de las 355 familias. Los niveles de 
ingresos para los diferentes estratos fueron fijados en forma caprichosa, (en este ejercicio) de tal manera 
que permitan la explicacion de algunos resultados, no esperados. 


Estrato I : Ingresos mensuales menores a $ 1.650.000. 

Estrato II : Ingresos mensuales entre $ 1.650.000 y $ 2.500.000. 

Estrato III : Ingresos mensuales superiores a $ 2.500.000. 

En la Tabla 13.2 que se encuentra en el Sistema de Informacion en Linea SIL, presentamos la 
poblacion de las 355 familias clasificadas en los tres estratos anteriormente establecidos. 
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Calculo de los tamanos muestrales 


Veamos la aplicacion de las formulas. En primer lugar, si consideramos que no existe forma alguna de 
obtener las varianzas poblacionales para cada estrato, hay necesidad de realizar una encuesta preliminar. 
Supongamos, arbitrariamente, que el tamano de la encuesta preliminar es del 4% del tamano poblacional, 
tal como lo hicimos en el Muestreo Aleatorio Simple, sabiendo que en la mayoria de los casos son 
decisiones que debe tomar el investigador. 

^preliminar = 0,04(355) = 14,2 = 14 familias 

Aplicando el metodo de asignacion igual, donde n 1 = n 2 = n^ se tendra: 

^preliminar 


14 

3 


: 4,67 =5 


L numero de estratos = 3 
15 


n 


preliminar 


Con los anteriores tamanos establecidos en la encuesta preliminar, seleccionamos 5 unidades en 
cada uno de los estratos poblacionales, utilizando la tabla de numeros aleatorios o la calculadora. 

Estratol (lngresosmenoresal.650miles$) 


NO. DE 
ORDEN 

No. 

ALEATORIO 

INGRESO 
MENSUAL 
(Miles $) 

PROPIE DAD 
VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO DIARIO 
DE CARNE EN grs 

Total 

H ombres 

Mujeres 

Trabajan 

1 

136 

1.460 

si 

3 

2 

1 

1 

508 

2 

008 

790 

si 

2 

0 

2 

1 

680 

3 

052 

1.560 

no 

4 

3 

1 

1 

720 

4 

036 

790 

no 

1 

0 

1 

1 

580 

5 

111 

1.450 

si 

2 

1 

1 

1 

632 


Estratoll (lngresosentrel.650 y2.500miles$) 


NO. DE 
ORDEN 

No. 

ALEATORIO 

INGRESO 
MENSUAL 
(Miles $) 

PROPIE DAD 
VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO DIARIO 
DE CARNE EN grs 

Total 

H ombres 

Mujeres 

Trabajan 

1 

028 

2.050 

si 

3 

2 

1 

2 

630 

2 

126 

2.050 

si 

3 

2 

1 

2 

630 

3 

096 

1.930 

si 

2 

0 

2 

2 

650 

4 

056 

2.080 

no 

3 

1 

2 

2 

638 

5 

088 

1.960 

no 

3 

1 

2 

2 

584 


Estrata III (I ngresos superiores a 2.500 miles $) 


NO. DE 
ORDEN 

No. 

ALEATORIO 

INGRESO 
MENSUAL 
(Miles $) 

PROPIE DAD 
VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO DIARIO 
DE CARNE EN grs 

Total 

H ombres 

Mujeres 

Trabajan 

1 

23 

2.730 

si 

3 

1 

2 

2 

816 

2 

55 

2.960 

no 

2 

1 

1 

2 

555 

3 

09 

3.950 

no 

5 

2 

3 

3 

680 

4 

18 

3.230 

si 

7 

2 

5 

3 

744 

5 

46 

2.936 

si 

3 

1 

2 

2 

686 
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A continuation, calculamos la varianza y la media del ingreso por familia en cada uno de los estratos. 
Xj = 1.210 X 2 = 2.014 X 3 = 3.161,2 S, = 385,8 S 2 = 65,0 S 3 = 475,41 

S 2 = 148.850 S 2 2 = 4.330 S2 = 226.017,2 f), = 5 fl 2 = 5 fl 3 = 5 

La media aritmetica estratificada sera igual a: 

7* = ZW h 7 h = 0,46 (1.210) + 0,37 (2.014) + 0,17 (3.161,2) = 1.839,18 (miles de$) 

Supongamos que el investigador establece de acuerdo a su experiencia, que el error (E) debe ser igual 
al 5% de X st y la confianza del 95%, es decir, Z = 1,96 

( E ) 2 (91,96\ 2 

V = \Y7 = l"X96“j =2.201,33 E = 0,05(1.839,18) = 91,96 

El numero de unidades en cada estrato poblacional es: 

Estrato I: N ] = 162 Estrato II: N 2 =132 Estrato III: N 3 = 61 

IN = N+ IV, + N= 162 + 132 + 61 = 355 IN = N = 355 

La proportion de unidades en cada uno de los estratos poblacionales es: 

N 1 162 A/ 2 132 

W i = J ^ = °’ 4563 “ °’ 46 6 46% W 2 = = 355 = 0,3718 “ 0,37 6 37% 

N s 61 

l/l/ 3 = =555=0,1718 = 0,17 6 17% 

Para determinar el tamano de la muestra en una poblacion estratificada, cuando utilizamos el metodo de 
asignacion o afijacion igual, se deben aplicar las siguientes formulas de acuerdo con la caracteristica, sea 
cualitativa o cuantitativa que se tome como referencia. 

a. Estimacion del promedio de ingresos por familia: 
n = -^IW 2 S h Siendo: 

Tambien se puede calci 


z z 


s (-f) J H ^ 2 - 201 - 33 


lar mediante: n = 


NZ 2 ZW h S 2 


NE 2 +Z 2 ZW h S h 2 


n = 


ZWiSi 


h^ h 

V 


y n 


1 + 


N 


La confianza es considerada del 95%, o sea z = 1,96 


n=~fr IfFA 2 



1 

n = 

0 

2 . 201,33 


[0,46(148.850)+0,37(4.330)+0,17(226.017,2)]=49,29 


n = 


n n 


1+ 


Ho 

N 


49,29 


1 + 


49,29 

355 


= 44 familias 


NZ 2 ZW h S 2 

si- n= -—— 

NE 2 +Z 2 ZW h S 2 h 
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355(1,96) 2 [0,46(148.850) + 0,37(4.330) + 0,17(226.017,2)] 
355(91,96) 2 +l,96 2 [0,46(148.850) + 0,37(4.330) + 0,17(226.017,2)] 


= 44 familias 


y los tamanos muestrales en cada estrato seran: yi = — 

y h L 


44 

Yl, = “5“ =15 Yl = 15 Yl. = 15 Yl = 15 n= n,+ «,+ n = 45 

A J 1 2 3 12 3 

b. En la estimacion de proporciones , antes que todo se debe familiarizar con la simbologia a utilizar, 
tanto en la aplicacion de las diferentes medidas muestrales como en los parametros. 


N = Tamano de la poblacion. 


A h = IA h = Numero de unidades que presenta la caracteristica, en cada estrato poblacional. 
P h = Proporcion de elementos que presenta la caracteristica en cada estrato poblacional. 


ZA h 


p h = 


N 


Pr 


N, 


P 2 = 


XA 2 


ZAj, 

p r 


N, 


= Varianza en los estratos poblacionales: S p =P h Q h S p =P 1 Q t S? p =P 2 Q 2 S p =P } Q } 
n = Tamano de la muestra. 


La = Numero de unidades que presenta la caracterlsticaen el estrato muestral. 


P 

h - n 


Za 7 . a 1 
p = —=—i 


Z a 2 


a 7 


p s = 




Ct¬ 

rl, 


P st = Proporcion poblacional estratificada: p= —6 P = ^W h P h 

P st = Proporcion muestral estratificada P= HN h p h ^ P s t = ^^hPh 

N 

Dentro del esquema que se ha venido siguiendo, en primer lugar se deben calcular los tamanos 
muestrales en cada estrato, para realizar estimativos de proporciones y totales, cuando se conocen y des- 
conocen las varianzas poblacionales. 


Con la informacion obtenida sobre familias propietarias de la vivienda, a traves de la encuesta pre- 
liminar a 15 familias, se tendra: 



(Es coincidencial el hecho que las proporciones sean iguales para los tres estratos). 

Ademas se sabe que: 

Wj = 0,46 W 2 = 0,37 W 3 = 0,17 ^=0,4 q 2 = 0,4 q 3 = 0,4 

z =1,96 E = 10% N = 355 N t = 162 N = 132 N 3 =61 
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Estos datos permiten trabajar con las formulas anteriormente vistas. En primer lugar veamos su 
aplicacion, para obtener el valor de n en los estimativos de una proportion , con un error del 10% y una 
confianza del 95%. 


n = 




(E/zy- 


Siendo n =. 


n, 


1 + 


JK_ 

N 


n= /TO t 2 [0,46(0,6)(0,4)+ 0,37(0,6)(0,4)+ 0,17(0,6)(0,4)] = 92,20 


(0,10 V 
11,96 ) 


„ 92,20 ~ nAif 

n = — n ;, or . = 74 familias 
i + z±2±y 
355 


Ahora si consideramos a p x = p 2 = p 3 = 0,50, el tamano de la muestra sera el maximo valor posi- 
ble; ademas, con nn error del 10% y confianza del 95%, se tendra: 


1 

n °~ 0,0026 


[0,46(0,5)(0,5) + 0,37(0,5)(0,5) + 0,17(0,5X0,5)] = 96,15 


n = 


96,15 


1+ 


96,15 

355 


= 76 familias 


Tambien podemos calcular n mediante la formula: 
Veamoslo: 


W, P A Q h 

NE 2 +Z 2 HW l P l Q l 

h h 


n = 


355(1,96) 2 [0 ? 46(0,6)(0,4) + 0,37(0,6)(0,4) + 0,17(0,6)(0,4)] 
355(0,10) 2 + 1,96 2 [0,46(0,6)(0,4) + 0,37(0,6)(0,4) + 0,17(0,6)(0,4)] 


= 76 familias 


El resultado debe ser exactamente igual aplicando cualquiera de las formulas anteriores. 


Calculo de estimativos y fijacion de limites 

En primer lugar consideraremos que el tamano de la muestra ( VI ) es igual a 36, en lugar de los resultados 
anteriores obtenidos, a fin de agilizar y simplificar operaciones. Teniendo en cuenta la caracteristica 
(variable) ingresos, una confianza del 95%, procederemos a calcular el estimador del promedio y fijar 
limites de confianza. 

Siendo n = 36, por el metodo de afijacion igual, se tendran los siguientes tamanos maestrales para 
cada uno de los estratos: 


n 


h = 


Jt 

L 



n 2 =12 


n 2 = 12 


n 3 = 12 n = 36 


Determinados los tamanos muestrales, se hara la seleccion de las unidades en cada uno de los estra¬ 
tos, con el fin de recoger informacion correspondiente cada una de las familias seleccionadas. 
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MUESTRA ASIGNACION IGUAL 

Estrato I (Ingresos inferiores a 1.650 miles $) 


NUMERO 

DEORDEN 

NUMERO 

ALEATORIO 

INGRESO 

MENSUAL 
(miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 

DIARIODE 

CARNEENGrs. 

Total 

Hombres 

Mujeres 

Trabajan 

1 

151 

1.230 

no 

3 

2 

1 

1 

605 

2 

008 

790 

si 

2 

0 

2 

1 

680 

3 

033 

790 

si 

3 

2 

1 

1 

600 

4 

122 

1.260 

no 

4 

2 

2 

1 

520 

5 

076 

1.260 

no 

3 

1 

2 

1 

516 

6 

082 

860 

no 

2 

1 

1 

1 

510 

7 

131 

790 

no 

3 

2 

1 

1 

509 

8 

096 

1.130 

si 

6 

2 

4 

1 

700 

9 

048 

890 

si 

2 

1 

1 

1 

720 

10 

055 

1.020 

no 

1 

1 

0 

1 

530 

11 

018 

860 

no 

1 

0 

1 

1 

510 

12 

076 

1.260 

no 

3 

1 

2 

1 

516 


Estrato II (Ingresos entre 1.650 y 2.500 miles $) 


NUMERO 

DE ORDEN 

NUMERO 

ALEATORIO 

INGRESO 

MENSUAL 
(miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 

DIARIO DE 

CARNEEN Grs. 

Total 

Hombres 

Mujeres 

Trabajan 

1 

020 

1.880 

no 

3 

1 

2 

2 

880 

2 

048 

1.940 

si 

4 

3 

1 

1 

536 

3 

111 

2.050 

si 

4 

2 

2 

2 

734 

4 

124 

2.360 

si 

4 

2 

2 

2 

716 

5 

076 

2.140 

si 

4 

2 

2 

2 

716 

6 

001 

1.860 

si 

5 

3 

2 

2 

789 

7 

032 

1.860 

si 

5 

2 

3 

2 

757 

8 

086 

1.720 

no 

5 

3 

2 

2 

584 

9 

116 

1.730 

no 

3 

1 

2 

2 

612 

10 

094 

1.990 

no 

4 

2 

2 

2 

532 

11 

035 

1.930 

si 

4 

2 

2 

2 

520 

12 

022 

1.870 

no 

2 

2 

0 

2 

520 
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Estrato III (Ingresos superiores a 2.550 miles $) 


NUMERO 

DEORDEN 

NUMERO 

ALEATORIO 

INGRESO 

MENSUAL 
(miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 

DIARIODE 

CARNE ENGrs. 

Total 

Hombres 

Mujeres 

Trabajan 

1 

25 

2.680 

si 

2 

1 

1 

2 

760 

2 

51 

2.880 

si 

2 

1 

1 

2 

724 

3 

58 

2.860 

si 

3 

1 

2 

3 

510 

4 

36 

3.890 

no 

3 

1 

2 

3 

802 

5 

08 

2.620 

si 

5 

2 

3 

3 

620 

6 

05 

3.130 

no 

5 

2 

3 

3 

868 

7 

11 

2.890 

no 

4 

2 

2 

2 

770 

8 

29 

2.870 

si 

3 

1 

2 

2 

555 

9 

37 

2.970 

no 

3 

1 

2 

2 

794 

10 

44 

3.860 

si 

3 

1 

2 

3 

830 

11 

19 

4.960 

si 

6 

2 

4 

4 

700 

12 

50 

2.980 

no 

3 

2 

1 

2 

600 


Ahora recordemos que la selection , se realiza mediante la aplicacion de EXCEL, de las Tablas de 
numeros aleatorios o la Calculadora, para la cual se toman 12 unidades en cada uno de los estratos, cuyos 
numeros esten comprendidos entre 001 y 162; lo mismo se hara para el estrato II entre 001 y 132 y para 
el estrato III, entre 01 y 61. Se ha acordado hacer la seleccion sin repeticion de las unidades. 

Con las anteriores Tablas, se pueden obtener diferentes estimadores tales como: promedios, pro- 
porciones, razones y proporciones en conglomerados, fijando limites de confianza para cada estimador 
puntual. 


Estimacion de promedios y totales 

a. Consideremos el promedio y el total de ingresos de las familias, calculando en primer lugar los 
promedios para cada uno de los estratos muestrales. 


Xx, 


*i = 


Zx 


3i 


12.140 

12 

38.590 


= 1.011,67 


Ix 2i 


x 2 


23.330 

12 


= 1.944,17 


x 3 


12 


= 3.215,83 


Las desviaciones tipicas muestrales para cada estrato seran: 


^1 = 


Xx^. - n.x] 


12.736.600-12 (1.011,67) 2 
12-1 


= 203,35 53 = 41.353,25 
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(Nota: Se trabajo en la calculadora con el programa de estadistica). 
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Lx. 2 - « 7 x 2 

n 2- 1 


lx l - n ,x 2 

_ii__3_1 


n 


3 


- 1 


1 


45.702.100 -12(1.944,1 7) 2 
12-1 

129.241.300-12 (3.215,83) 2 
12-1 


176,98 


683,74 


s 2 = 31.321,47 

s 2 = 467.504,45 


La Media muestral estratificada sera igual a: 


x = lW h x h = 0,46(1.011,67) + 0,37(1.944,17) + 0,17(3.215,83) = 1.731,4 6 $ 1.731.402,2 


La formula para fijar los llmites de confianza para el promedio, es: 


X = x± 

St St 




S? 




— 1 r 4135375 3137147 46750445 

x= 1.731,4±2,035 ]T^ 2 162(162-12)—^ + 132(132-12)—^ + 61(61-12) ' u ’ 

y 1.820,49 = $ 1.820.490 

Xs, =1-731,4 ±89,09 \ 

f 1.642,31 =$ 1,642,310 


A1 fijar los limites de confianza del 95% para el promedio, el valor de t, sera: 

3) = Wj + n 2 + n 3 - 3 = 12 + 12 + 12 - 3 = 33 

Para 3) = 33 y a = 0,05, se tendra que t = 2,035 


En los estimativos de totales para establecer los llmites de confianza del 95%, se procedera de la 
siguiente manera: 


X, =Nx ±t- 

st s st 


n h )\ 


2 

h_ 

h 


El estimador de la varianza con el cual se obtiene el error de estimacion, se puede calcular de la 
siguiente manera: 


si? 


F M =EA 'i (K -«,)- 


n, 


■s 41 353 25 31 321 47 467 504 45 

fx , =162(162-12) _ +132(132-12) _ + 61(61-12) _ =241.532.238,5 


12 


* =355(1.731,4) ±2,035^241.532.238,5 


12 12 

646.273,56 s $ 646.273.560,7 

^ 583.020,44 = $583.020.439,3 


Con las anteriores tablas se pueden obtener los diferentes estimadores de: promedios, proporciones , 
razones y proporciones en conglomerados , fijando limites de confianza para cada estimador puntual. 
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El estimador de la Varianza con el fin de obtener el error de estimation, se puede calcular mediante 
la formula: 


V- = 

Pd 

t * 


=> siendo: 

X =x ± n 

St St \ 

1-/1 

n 



Veamos comcse calcula, tomando los anteriores resultados muestrales: 


V = 

Pd 


,36 

355 


36 


[0,46(41.353,25) + 0,37(31.321,47) + 0,17(467.504,45)] = 2.747,87 


1.838,08 

X s = 1.731,4 ±2,035 tJ 2.747,87 (miles de $) 

1.624,72 


La diferencia observada es minima con respecto al estimador de X, resulta al ser calculadas con 
todos los decimales, ya que los resultados deberan ser exactamente iguales. Algo similar sucede con la 
siguiente formula, al calcular el estimador de la Varianza. 


V r 


i X St\ 2L 


FTfs? 


n , 


d-/,) 


X = x st ± \ 

y 

w l s l (i 


\ 


n h J 



'fail 


'0,46 2 (41353^5)]f 

, 12 ' 


'0,37 2 (31.321,47)1 \ 

1 _ 12 ' 


0,17 2 (467.504,45)1 [ 12' 

12 J[ 

1 162 _ 

+ 

12 J[ 

132 

+ 

12 Ji 1 61 


=1.904,44 


b. Para el calculo del promedio y total de personasporfamilia , el procedimiento es igual al utilizado 
para los ingresos. 


x, = 2,75 


x, = 3,92 


x = 3,5 


S) = 1,84 S 2 =0,81 S 3 =l,55 


x = 0,46(2,75) + 0,37(3,92) + 0,17(3,5) = 3,31 personas por familia. 


% =_L 


Pd 


355 2 


162 (162-12)184 + 132(132-12) Ml + 61(61-12) ill 
12 12 12 


= 0,041 


X st = 3,31 ±2,035^0,041 


^ 3,72 = 4 
' S * 2,89 = 3 


(Promedio de personas) 


^ * 1.320,06 = 1.321 

1 = 355(3,31)±355(0,41) 1 (Total de personas) 




1.029,5 = 1.030 


c. Si desea estimar y fijar limites de confianza del 95%, para el consumo promedio y total de carne 
diario de las familias, se tendra: 

x= 576,33 x 2 = 658,0 1 = 711,08 s 2 =6.726,97 s 2 = 15.017,27 s 2 = 13.226,45 

0,46(576,33) + 0,37(658) ± 0,17(711,08) = 629,46 gramos de came diaria. 


K- 


1 


Pd 355 2 


162 (162-12) 6J ^ ,97 + 132(132-12) 61(61-12) 13 ' 2 ^ 45 


= 291,52 
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(Promedio diario de consumo de came) 


,- 664,21 

X st = 629,46 ±2,035 ^291,52 = ^ 

i 594,71 

235.791,0 

j£> _ 355(629 46) ±355(34 74) — (Total de consumo para las 355 familias) 


Estimation de una proportion y total 

A traves de los resultados obtenidos en la encuesta correspondiente a la muestra de 36 unidades, se 
calcularan las proporciones muestrales en cada estrato, para la proportion y total de familias propietarias 
de vivienda. 


Ea 


Pf 




«i 12 


Ea . 7 

= 0,33 q x =0,67 ^=-^=^-=0,58 q= 0,42 


Ea 3i _ 7 _ 
m 12 


: 0,58 


q = 0,42 Siendo: p 




N 




p = 0,46(0,33)+0,37(0,58)+0,17(0,58) = 0,465 o 46,5% son propietarios. 


Para el estimador de la varianza en la proporcion, su calculo es similar al utilizado para la variable; 
veamos el primer procedimiento: 


F [P sii = N 2 


Pjfh 

n h 


Siendo: P = p s ± N 2 [ m/N h -nj 


1 


P h <l h 


F [P s<] 355 2 


162(16242)M + 132(13242)™ + 61(6M2)®' 


829,9562 

126.025 


= 0,0066 


Tambien podemos obtener este mismo resultado, mediante un segundo procedimiento , como se 
puede observar a continuacion: 


V = 

py 


i-/' 


&W h p h q h ] Siendo: P=P st ±t 


1 -/ 


&W h p h q h ] 


V, 


[p s /] 


1_36 

355 


36 


[0,46(0,33)(0,67) + 0,37(0,58)(0,42) + 0,17(0,58)(0,42)] =0,0058 


y por el tercer procedimiento, para el calculo del estimador de la varianza se tendra: 

Siendo: P=P st ±p 


V = E 

[p s d 




V = 
w 


0,462(0,33X0,67)' 


12 




1 - — 

162 


KPh^h 


[i-/J 


0,37 2 (0,58X0,42)' 


12 


' 12' 


32_ 

+ 


0,17 2 (0,58)(0,42) 
12 


]K 


= 0,0066 
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Los limites de confianza del 95% para la proportion defamilias con vivienda seran: 


p st =P xt ±t 


1 v b«! 



63,03% 

29,97% 


Proporcion 
de familias 
con vivienda 


y los limites de confianza del 95% para el total defamilias con vivienda seran: 


A«r N P« ± tN 



* 224 

l st = 355(0,465) ± 355(0,165) \ 

' 107 


Total 

de familias 
con vivienda 


Estimacion para la razon, promedio y el total 

El estimador de la razon en el muestreo aleatorio estratificado se puede efectuar de dos maneras: en el 
primer caso, se le denomina estimacion mediante la razon separada, ya que esta se obtiene en forma 
separada para cada estrato. 


a. La razon separada para una poblacion estratificada sera obtenida mediante la formula: 


&= 


A 

x h 


(Razonpara cada estrato) 


1 x i 


t=— 


x 2 


X , 



b. En el segundo caso, se le denomina razon combinada , siendo: 


y o f 

n — —±L 
/v — f 

st ^ st 


X 

st h h 


y s r^ w h y h 


El estimador de la varianza , para cada uno de los casos, para calcular luego el error de estimacion 


t = X 

\ l ~ fh \ 

[s 2 - 2fi p s s + ft: s 2 ] 

L y h h r h yh x h h x h A 

. n X . 


V = X 

[1-41 

[s 2 - 2$ p s x s v , + ft s 2 ] 

L c 'h x h rh c x h* 

. n A . 


Para la aplicacion de estas formulas, consideraremos los datos obtenidos a traves de la muestra de 
36 familias y como caracteristicas, para la estimacion de la razon, la relacion que hay, entre hombres (x) 
y mujeres (y). 


Las medias aritmeticas, para hombres y mujeres en estos estratos seran: 


15 -1,25 

1 12 

Xx,,. nr 

x =—— = — =2,08 

2 n 2 12 

i - 2X31 = 17 - 1,42 
3 n 3 12 

v =l^=i 5 

/i 12 'P 

22 

J 2 =lf = 1.83 

y = j f = 2,08 
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Mujeres 

R h = Razon estimada en cada estrato = Hombres 


S.ZL_iA_ n 

R ~ Xj “ 1,25 “ 1,2 


&,=-^=Ml =0,88 


'2 x 2 2,08 


2,08 
x 3 “ 1,42 


^ 3 ~ t - 1>46 


El calculo de la Razon separada en este ejercicio, sera: 


R s = E W h R h 

s st h h 


R s =0,46(1,2) +0,37(0,88) +0,17(1,46) =1,13 


La relacion obtenida nos permite indicar que por cada 7 hombres, hay 8 mujeres 

y =0,46(1,5) +0,37(1,83) +0,17(2,08) =1,7207 


R = Razon combinada 

= W85 


X , = 0,46(1,25) + 0,37(2,08) + 0,17(1,42) = 1,586 


En el calculo del estimador de la varianza de los dos casos anteriores, se requieren algunas opera- 
ciones preliminares: 

Las desviaciones tipicas y las varianzas de la variable X\ 

s =0,75 s =0,67 S =0,51 s 2 = 0,57 s 2 = 0,45 s 2 = 0,27 

x-^ -^3 -Tj x 2 x 3 

(Nota: Se trabajo en la calculadora con el programa de estadistica) 

Las desviaciones tipicas y las varianzas de la variable y: 

5 =1 5 =0,72 5 =0,90 s 2 = l s 2 = 0,52 s 2 = 0,81 


El valor de p (rho) se obtiene de la siguiente manera: 


d 

pM 


2d 


P = — 1 
1 2d 


P = — 1 
2 2d 


P = — 1 
2 2d 


Los valores de los c oeficientes de variation de d xh y d h son calculados asl: 


j ^*1 0,75 .. - 

d *i~ \ "1,25" 0,6 


/ _ s x2 _ 0,67 _ ~ 
x 2~ * 2 "2,08 " ' 


i _ 0,51 _ ~ ^ 

dx ~ *3 “1,42“ 0,36 


l _ S y\ _ 1 _ r\ c-i i _ S y2 _ Q/72 _ ~ -xq 

d y~ y, ~ 1,5 ~ 0,67 d y~ y 2 "1,83“ 0,39 


l _ s y3 _ Q>9 _ ~ 

d y~ "2,08" 0,43 


d x \ 0,6 


d~ 0,32 _ n d x3 0,36 


Pl ~2d] ~ 2(0^67)~ 0 ' 44 Pl ~2d n - 2(6,39) " 0,41 ^~2d' "2(0,43) 


Las fracciones de muestreo para cada estrato seran: 


/i= 


12 


N 3 162 


= 0,074 / = 


12 


= 0,42 


2 N 2 132 


= 0,09 f = 


12 


3 N 3 61 


= 0,20 
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Con la informacion anterior se podra hacer el calculo de los estimadores de la Varianza. 


a. El estimador de la varianza o error de estimacion al cuadrado para el metodo de la Razon 
Separada 

v k = 1 1 ,2)(0,44)(0,75)( 1 ) + 1,2 2 (0,57) + 

12 ( 208) 2 0,52 2 ( 0 ’ 9 X 0 ’ 41 )( 0 ’ 67 )( 0 ’ 72 ) + 0 ’ 92 (°’ 4 5) + 

^^2 0,81 2(1,46)(0,42)(0,51)(0,9) + 1,46 2 (0,27) = 

04938(1,0108) + 0,0175(0,5285) + (0,0331)0,82261 =0,0864 


R 


‘ =R±t\V k /?. = 1,13 2,035 A 0,0864 =1,13 060 

s st s S K s Sst s ’ ’ ’ ’ 




1,73 

0,53 


b. El estimador de la varianza o error de estimacion al cuadrado en el metodo de la Razon 
Combinada: 

V k = 1 2(1,085)(0,45)(0,75)(1) +1,085 2 (0,57) + 


1 0,09 


12(1,25) 2 

1 0,20 

12(1,42) 


0,52 2(1,085)(0,41)(0,67)(0,72) +1,085 2 (0,45) + 
2 0,81 2(1,085)(0,42)(0,51)(0,9) +1,085 2 (0,27) = 


V k = 0,04938(0,9386) +0,0175(0,6206) +0,0331(0,7095) =0,0807 


R —R ± t 

°st s C 


K c 


R c =1,085 2,035 JO,0807 

c st s \ V 

i ^ 


1,66 

0,51 


A partir del estimador de la razon en el Muestreo aleatorio estratificado as! como en el Muestreo 
aleatorio simple, se pueden hacer estimativos de promedios y de totales, tanto con la Razon Separada 
como la Combinada: 

a. Y r = YjW.R.X, Y r =NZW u RX b. ? R =RX : Y rc =NR X 

K s h h h K s h h h K c c st c st 


Recordemos que: =N 


h =N h h (Total) 


Ahora supongamos que se tiene informacion sobre el valor de la media aritmetica poblacional por 
cada estrato y para el total, 


Y R =0,46(1,5)(1,2) +0,37(0,9)(1,8) +0,17(1,46)(2) =1,924 = 1,9 Promediodemujerespor amilia 
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Los limites de confianza del 95%, para el estimador del Promedio de mujeres por familia: 


= JLW,R,X, ± t 


h h h 


if, 

Z - s 2 2 R,p,s v ,s x , + R:s 2 x , 

n yh h ~ h yh x h h x h 


V. = 1,9±2,035- 

yjt s 


1 0,074 1 2(1,20)(0,44)(0,75)(1) +1,2 2 (0,57) + 1 ^° 9 + 


12 

0,52 2(0,9)(0,41)(0,67)(0,72) + 0,9 2 (0,45) + 

0,81 2(1,46)(0,42)(0,51)(0,9) +1,46 2 (0,27) 


12 




2,74 


Y d = 1,9 ± 2,035 i 0,1685 \ Promedio de mujeres por amilia. 

*1 1 ^ 1,06 

Como conocemos el promedio estimado en la Razon Separada, se podra obtener el estimador por 
intervalos para el total de mujeres en las 355 familias. 




1 f h 

— s y 2 h 2R f , pm 


+ B: 


V 

x h ' 


= 1,9(355) ±2,035(355) 

i 


0,1685 




971,04 = 971 


v Total mujeres en las 355 amilias. 

^ 371,95 =372 


En la razon combinada, el promedio y total se calculan de la siguiente manera: 
Y r =RX s =\ , 085 ( 1 , 7 ) = 1,85 Promedio de mujeres por amilia. 


Para el total se tendra que: 

Y r = RXN = 1 , 085 ( 1 , 7 )( 355 ) = 654,80 = 655 Total de mujeres en las 355 amilias. 

Los limites de confianza del 95%, tanto para el Promedio como para el Total, se debera en primer 
lugar calcular la Varianza estimada : 


Y»_ = 


*Cst 


y st 


L J 

±, \ 


1 A 


X ~ Sy h 2R p,s h s , + R 2 s 2 

yi yh c r h x h yh c x u 


Limites de confianza del 95% para el promedio de mujeres por familia. 


Y . =1,85 ±2,035 


1 2(1,085)(0,44)(0,75)(1) +1,085 2 (0,57) + 
0,52 2(1,085)(0,41)(0,67)(0,72) +1,085 2 (0,45) + 

0,36 2(1,085)(0,42)(0,51)(0,9) +1,085 2 (0,27) 
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Y R =1,85 ±2,035 

KC S 


0,0807 


^ 2,42 

^*1,27 


Los limites de confianza del 95 para el Total de mujeres en las 355 ami lias 

881,97 =882 


Y =1,85(355) ±2,035(355) 


0,0807 =656,75 205,22 


X, 


Total 

mujeres 


k 451,53 =452 

ESTIMACION DE PROMEDIOS Y TOTALES MEDIANTE LA REGRESION LINEAL SIMPLE 


Dentro de los diferentes metodos de estimacion que se han venido estudiando, tambien se utiliza la 
regresion lineal , al igual que la razon y se les considera como metodos indirectos para estimar promedios 
y totales. 

En el caso de la regresion lineal , se usan dos formas para calcular el estimador del promedio y del 
total, mediante la regresion lineal separada y regresion lineal combinada. 


a. En la regresion lineal separada , la ecuacion general para el estimador del promedio sera: 


Yrl = y h + b h (X-X h ) 


Yh - n, 




x h n , 


RL = Regresion lineal 

b h = es el coeficiente angular o pendiente para cada estrato muestral 


K=~ 


z (Yhi YXhi 


2(x hi x h/ 


T .. f nYx J hi (XXX 

Tambl n: b *T nlrt. (Ex,.) 2 


Con la informacion obtenida a traves de una Muestra estratificada (<asignacion igual) de 36 familias, 
estimar el consumo promedio de came diaria (en gramos) en funcion del nivel de ingresos, asi: 


Estrato I 

Ex 1 =12.140 

2x 2 =12.736.600 

2y x = 6.916 

2^=4.059.918 b= 0,07496 

sj = 41.360,61 

2x^=6.962.580 

x=1.011,67 

r i= 0,19 y=576,33 s^= 6.726,97 

Estrato II 

2x 2 = 23.330 

2x 2 =45.702.100 

2y 2 = 7.896 

2y 2 2 =5.360.758 Z> 2 = 0,12556 

%=31.335,61 

Ix 2 y 2 =15.394.420 

x 2 = 1.944,17 

r 2 =0,18 y 2 = 658 %= 15.017,27 

Estrato III 

2x 3 = 38.590 

2k 3 =129.241.300 

2y 3 = 8.533 

2y 2 = 6.213.165 b= 0,04686 

5^=467.481,06 

2t 3 y 3 =27.681.670 

x 3 =3.215,83 

/•3=0,28 y 3 = 711,08 sj= 13.226,45 
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Calculamos las b h : b v b.. y b. mediante formulas que anteriormente fueron presentadas: 


, 12(6.962.580) (12.140)(6.916) nn _. Q , 

1 12(12.736.600) (12.140) 2 


b = 


12(15.394.420) (23.330)(7.896) 
12(45.702.100) (23.330) 2 


= 0,12556 


b = 


12(27.681.670) (38.590)(8.533) 
12(129.241.300) (38.590) 2 


= 0,04686 


Para efectuar los estimativos de Promedio, mediante la Regresion lineal, se debe conocer o suponer 
conocida la Media poblacional de X h (medias) para cada estrato, que seran dadas en este ejercicio asi: 


X =1.080 X 2 = 1.850 X 3 = 3.220 


Con estos valores se podran determinar los Promedios estimados de Y: 
y RLl = 576,33 0,07496(1.080 1.011,67) = 571,21 

yRL 2 = 658,0 +0,12556(1.850 1.944,17) = 646,17 

y^ = 711,08 + 0,04686(3.220 3.215,83) = 711,27 

La Media ponderada en la Regresion separada sera igual a: 

$RL S =ZW h y RLh y^ 0,46(571,21) +0,37(646,17) +0,17(711,27) = 622,76 

Calculemos ahora el Estimador de la Varianza , para luego obtener el error. 


~ v y »?<i /,) 

V „ —2j - s. 


2 2b,m r „+b 2 s 2 


'rl s n h 'h h Yh h ~h 

Calculo de las Covarianzas : (Nota: se trabajo en la calculadora con el programa de estadistica). 

XriYi 


m x i Vi 


i y i n , 


^y = 6.961580 d on,67)(576,33) = 2.840,77 


Xr 2 y 2 - - 15 3Q4 470 

m x ^=- —?r— x 2 y 2 = C; (1.944,17)(658) =3.604,47 


X H2 jj 


12 




Xr 3 y 3 


3 y 3 W 


* 3 y 3 = 27,6 ^' 67Q (3.215,83X711,08) =20.093,44 


Tambien se puede calcular la Covarianza para cada estrato de la siguiente manera: 


»+v„, 


Cov v," m vr 


m Y 


Zx hi y hi n h [x h )[y h , 


Kh 


6 
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Obtenidas las Covarianzas se podra determinar el estimador de la varianza ; para calcular el error, 

xx 0,46 2 r 355 

V m = -(6.726,97) 2( 0,07496)( 2.840,77) +( 0,07496) 2 (41.360,61) + 


0,37 2 


1 

lT 



(15.017,27) 2(0,12556)(3.604,47) + 0,12556 2 (31.335,61) + 


0,17 2 


1 

lT 



(13.226,45) 2(0,04686)(20.093,44)+0,04686 (467.481,06) =291,02 


Los limites de confianza del 95% para el estimador del promedio de consumo diario seran: 


YrL Ss yRL s t \ Vj 




657,50 


Y = 622,78 2,0351 291,02 C Consumo diario de came en gramos 

S S 588,06 

i 

b. En la regresion lineal combinada , el proceso a seguir, para el estimador del promedio sera: 
Yrl =y+b(x-xj 


Calculamos en primer lugar las medias aritmeticas, tanto de X como de Y: 


=lW h y h = 0,46(576,33) + 0,37(658) + 0,17(711,08) = 629,46 
x f = ZW h x h = 0,46(1.011,67) + 0,37(1.944,17) + 0,17(3.215,83) = 1.731,40 
Suponiendo queX ( =1.729 (pobiacionai) Setendra: 
y = 629,46 + 0,01994(1.729 1.731,40) = 629,41 

El coeficiente angular combinado se calculo de la siguiente manera: 
b=YM h b = 0,46( 0,07496) +0,37(0,12556) +0,17(0,04686) =0,01994 


Estimador de laVarianza o Error de estimacion al cuadrado en la Regresion lineal combinada: 

- w:(\ f) 

t/ v* h'' ^ h' o 07 , j 2 2 

Vy =2 —-- s; 2b m + b s x 

y RL n , y h c Yh c h 


Vy = 


0,46 2 |l 162 

12 


(6.726,97) 2(0,01994)( 2.840,77)+0,01994 2 (41.360,61) + 
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h 12. 
0 , 37 2 1 1 ]32 

12 


(15.017,27) 2(0,01994)(3.604,47) + 0,01994 2 (31.335,65) + 


0 , 17 2 1 1 W 

12 


(13.226,45) 2(0,1994)(20.093,44) + 0,1994 2 (467.481,06) =290,42 


Los Hmites de confianza del 95 para el estimador de ' seran: 


Y K j =y RI u V v 

KL c s kl c \ yRL c 

7 




664,08 


Y rl = 629,41 2,035 a 290,42 \ Consumopromediodiariodecarneengr. 

e f 594,73 


El resultado anterior significa un consumo diario promedio de came por familia de 629,41 gramos; 
pero el verdadero consumo promedio, estara entre 594,73 y 664,08 gramos, con una confianza o seguri- 
dad del 95%. 

ESTIMACION DE UNA PROPORCION Y EL TOTAL EN CONGLOMERADOS 

En el muestreo aleatorio estratificado con asignacion igual, al estimador de la proporcion cuando la 
unidad se constituye en conglomerados es igual a: 


p “ M 


siendo: 


Za 7 


X/77, 


M h = Nm h y = M 


El estimador de la varianza o error de estimacion al cuadrado sera igual a: 

y =1 0 ll ZPh&hPJ + P^k, 

V p„ n.ml n L 1 


Los limites de confianza estaran dados por la ormula: 


Ps, + 


\ 


st 


Para la aplicacion de estas formulas tengamos en cuenta la informacion correspondiente a la mues- 
tra de 36 familias y como caracteristicas, el numero de mujeres y el total de personas por familia, con el 
fin de determinar la proporcion y el total de mujeres. 


1TI. = Numero de personas por Familia 

a. = Numero de mujeres por Familia 

Calculamos el valor de p para cada uno de los estratos: 
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La =18 

ll 


La =22 La = 25 La r m =62 Lm =33 

2i 3i li li li 


'Em =47 

2 i 


Lm =42 

3i 


18 


22 


25 


Sa 2 i w 2 i= 91 Ea y m y =99 p=—=0,545 /? 2 =—= 0,468 />=—=0,595 


47 


3 42 


Para el calculo del estimador de la varianza se requiere de informacion complementaria: 

La 2 =38 La 2 2i = 46 La 3i = 61 Em\= 111 Em\= 193 
Lff7 2 =164 Wj= 2,75 m 2 = 3,92 w 3 =3,50 


12 


^ N x 162 0,074 a/; 132 


12 


a, 12 

= 0,091 / 3 = A^ = -gT = 0,197 


El estimador de la varianza sera igual a: 


p _ 1 0,74 38 2(0,545)(62)+(0,545) 2 (lll) 1 0,091 46 2(0,468)(91)+(0,468) 2 (193) 

y p„~ 12(2,75) 2 12 1 + 12(3,92) 2 12 1 

1 0,197 61 2(0,595)(99)+(0,595) 2 (164 ) = 0 00508 


Los limites de confianza del 95% para la proporcion seran: 


Pst s Pst h 


t 


~ M 


El Total de elementos en los Conglomerados de cada estrato (M h ) se puede calcular de dos maneras: 
la primera, mediante la aplicacion de la formula EM /z = Nm h 

M 1 = 355(2,75) = 976,25 M = 355(3,92) = 1.391,6 M h = Nm h 
M 3 = 355(3,50) = 1.242,5 ZM h =M= 3.611 

El anterior procedimiento de calculo de M h es muy comun, sin embargo se aconseja que en la prac- 
tica se haga de una manera mucho mas facil y practica, siendo asi: 


M = E?V,m, = EM 

h h h 


siendo M = 162(2,75)=446 M=132(3,92)=517 M 3 =61(3,50)=214 M=LM=446+517 + 214=1.177 

Este ultimo procedimiento lo vamos a utilizar en nuestros calculos 

446(0,545) +517(0,468) +1.214(0,595) 


p =■ 

1 st 


1.177 


= 0,52 =52 son mujeres 


P =0,52 2,035 


- j*66,5 

0,00508 Porcentaje de mujeres 

^* 37,5 
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El anterior resultado nos indica, que un 52% de las personas en el barrio investigado son mujeres y 
el 48% restante hombres. Sin embargo, la proporcion verdadera de mujeres debera estar entre 37,5% y 
66,5%, con una confianza o seguridad en la estimacion del 95%. 


Si se desea estimar el Total de personas en las 355 familias, ademas del metodo anterior, cuyo resul¬ 
tado fue de 1.177 personas, tambien se puede calcular el valor de M, de varias maneras, asi: 

M = N(x) = 355(3,3104) = 1.175 personas 

Tambien: M = N[m) = 355(3,3888) = 1.203 personas 


Los limites de confianza del 95% para el total de mujeres en las 355 familias se obtendran de la 
siguiente manera: 


£st =M P„ tMi 


V 


A a = 1.177(0,52) 

S 


2,035(1.177), 


0,00508 




783 

Mujeres 

441 


Lo anterior nos indica que, aproximadamente 612 personas son de sexo femenino y 565 masculino. 
El verdadero total de mujeres (poblacional) debera estar entre 441 y 783, con una seguridad del 95%. 


EJERCICIQS PARA RESOLVER 



La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 


72. Dada la siguiente poblacion estratificada 



Se pide extraer una muestra 
de tamano 9 (tamano de 
la encuesta preliminar) 
aplicando Afijacion igual 
y calcular el tamano de la 
muestra, trabajando con 
un error del 6% y una 
confianza del 95%. 


73. Se tiene la siguiente poblacion de 20 unidades. 


No. DE ORDEN 

01 

02 

03 

04 

05 

06 

07 

08 

09 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

x 

i 

10 

6 

12 

11 

6 

8 

14 

13 

14 

10 

9 

8 

7 

12 

10 

16 

6 

10 

15 

8 


Informacion adicional: LX. = 205 LX 2 = 2.281 


Con base en una muestra aleatoria simple se desea estimar X y X 

a. Determinar el tamano de la muestra (aleatoria simple) con un error de 2 y una confianza del 
90%. 

b. Seleccionar una muestra de tamano igual al determinado en el punto anterior. Calcular el 
estimador del promedio y total de jc 1? fijando limites del 95%. 
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74. Dividir la anterior poblacion en dos estratos de tamanos 13 y 7 respectivamente, indicando el 
criterio empleado al realizar dicha estratificacion. 

a. Seleccionar una muestra de tamano 6 (encuesta preliminar) y mediante la asignacion igual 
calcular el valor Yl , con un error del 9% y confianza del 95,5%. 

b. Considerando el tamano de la muestra igual a 6, estimar el promedio y el total de X, fijando 
limites de confianza de 95%. 


75. Con los siguientes datos 



Continuacion 


2V* 


y„ 

s xh 

S yh 


1.770,66 

8,47 

10,37 

0,83 

1,26 

8,2 

4.045,23 

12,32 

16,22 

1,69 

3,74 

14,0 

9.763,78 

17,81 

27,17 

10,44 

2,32 

19,6 

29.391,08 

33,84 

42,31 

3,54 

4,37 

31,2 


76. Con los datos del ejercicio 75, se pide: 

a. Estimar el promedio y el total , fijando limites de confianza del 95% 

A 

b. Estimar el promedio y el total de , fijando limites de confianza del 95% 


77. Con los datos del ejercicio 75, se pide: 

a. Estimar la proporcion y el total de A, fijando limites de confianza del 95% 

b. Estimar el promedio total de Y mediante la regresion lineal (combinada), si = 22,6, fijando 
limites de confianza del 95%. 

78. Con los datos del ejercicio 75, se pide: 

a. Estimar el promedio y el total de , mediante la regresion lineal (separada), fijando limites de 
confianza del 95%. 

b. Estimar el promedio y el total de , mediante el metodo de la razon (combinada), si = 22,6 
fijando limites de confianza del 95%. 

c. Estimar el promedio y el total de , mediante el metodo de la razon (separada) si st = 22,6, 
fijando limites de confianza del 95%. 

79. Se tiene la siguiente informacion: 


P =95 

E =2,1 (promedio) 

E = 0,08 (proporcion) 


80. Con los datos del ejercicio 79, se pide: 

a. Determine el tamano de la muestra, aplicando el metodo de afijacion igual, suponiendo que los 
anteriores resultados corresponden a una encuesta preliminar. 
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b. Estime el promedio y el total de , fijando limites de confianza del 95% 

c. Estime la proporcion y el total de P, fijando limites confianza del 95% 

81. Con los siguientes datos: 

Estrato I 


No. DE ORDEN 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

X: 

17 

9 

9 

18 

23 

32 

21 

23 

15 

22 

16 

15 

19 

28 

25 

19 

14 

18 

23 

12 

Y : 

i 

9 

6 

7 

10 

16 

18 

14 

14 

10 

17 

11 

19 

12 

5 

13 

11 

10 

12 

13 

8 

A. ; 

si 

si 

no 

si 

si 

no 

no 

si 

si 

si 

si 

no 

si 

no 

no 

si 

no 

no 

si 

si 


Estrato II 


No. DE ORDEN 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

X. : 

40 

53 

49 

38 

42 

54 

50 

43 

47 

59 

63 

58 

45 

46 

54 

Y : 

i 

23 

36 

30 

22 

26 

32 

27 

24 

21 

32 

32 

35 

28 

23 

29 

A.: 

no 

no 

si 

si 

no 

si 

si 

no 

si 

si 

no 

si 

si 

no 

si 


Estrato III 

No. DE ORDEN 

1 

2 

3 

4 

5 

6 

7 

8 

9 

to 

11 

X.: 

76 

82 

74 

80 

86 

91 

74 

81 

78 

83 

76 

Y : 

i 

51 

47 

45 

54 

54 

52 

45 

47 

46 

52 

51 

A.: 

si 

si 

no 

si 

si 

no 

si 

no 

si 

si 

no 


Considerar los datos anteriores como la informacion de una poblacion y seleccionar una encuesta 
preliminar de 12 elementos con el fin de determinar el tamano de la muestra, mediante el metodo 
de asignacion igual. Error del 4% para la variable y del 10% para la proporcion y una confianza 
del 95% 

a. Utilizar la variable X, para realizar los calculos. 

b. Utilizar la caracteristica A para las respuestas «si». 

82. Con los tamanos muestrales (asignacion igual) para la variable Y, proceda a: 

a. Estimar el valor de Y RLs y Y RLc mediante la regresion lineal, sabiendo que X x =24 X 2 = 56 
X 3 = 82 y una confianza del 95% 

O' /\ 

b. Estimar el valor de X y X (total) utilizando una confianza del 90% 

c. Estimar el valor de P y K, utilizando una confianza del 99% 
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83. Con la siguiente informacion: 

Estrato I 


No. 

Yi 

X 

1 

12,6 

8,4 

2 

13,0 

7,2 

3 

12,8 

8,3 

4 

12,6 

9,5 

5 

13,0 

9,4 

6 

12,9 

10,1 

7 

13,5 

8,2 

8 

14,0 

9,6 

9 

13,2 

8,4 

10 

12,4 

8,6 


Seleccione una muestra de tamano 18, aplicando el 
metodo de Asignacion igual y, estime R $ fijando 
limites de confianza del 95%. 

Se sabe ademas que =19,18 j = 9,1 2 =17,3 

" 3 -27,1. 

84. Con la misma muestra obtenida en el punto anterior 
estime Y RLs y Y RLc fijando limites de confianza 
del 95%. (Considere los valores dados en el punto 
anterior en el caso que los necesite). 


84. Con los siguientes datos: 

Estrato I 



Estrato II 
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Estrato III 



Informacion complementaria: 

M = 150 viviendas N 2 = 75 N 2 - 50 N 3 = 25 Z = 2 (P = 95,5%) E = 5% 

Estrato I : Viviendas de menos de 5 personas 
Estrato II : Viviendas de 5 a 8 Personas 
Estrato III : Viviendas de 9 y mas personas 


85. Con los datos del ejercicio anterior, se pide: 

a. Considerar que los anteriores resultados fueron obtenidos mediante una Encuesta preliminar 
(Asignacion igual) y determinar el tamano de la muestra. 

b. Estimar la proporcion de mujeres, fijando limites de confianza del 95% (Conglomerados). 

86. Con los datos del ejercicio anterior, se pide: 

a. Estimar la Razon combinada: Mujeres/hombres y fijar limites de confianza del 95% para el 
estimador. 

b. Estimar la Proporcion de viviendas con servicio de luz y agua y fijar limites del 95% de confianza 
para el estimador. 


ASIGNACION PROPORCIONAL 


Este metodo nos permite determinar el tamano optimo de la muestra, asi como los estimados puntuales 
y limites de confianza para el promedio , proporcion, razon , y proporciones en conglomerados , en forma 
similar al de la Asignacion igual, con la diferencia de que los tamanos maestrales de cada estrato, en 
vez de ser iguales en cuanto al numero de unidades, estos se distribuyen en la misma proporcion que 
las unidades en la poblacion; en otras palabras, el peso relativo dado por el numero de unidades en cada 
estrato en relacion al total de elementos de la poblacion, debe ser igual al obtenido en la muestra. 


W h = 


N 



W u = w. 

h h 


n 


Siendo: 
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Mediante este procedimiento, al igual que en el de Asignacion igual y optima , se pueden obtener 
mejores estimaciones que a traves del Muestreo aleatorio simple , ya que es posible contener en la mues¬ 
tra, unidades de todos los tipos y caracteristicas, haciendola de esta manera mucho mas representativa 
de la poblacion. 


Tamano de la muestra 


Como en todos los casos tratados anteriormente, cuando no se conoce la Varianza poblacional de la 
caracteristica principal de la investigacion, para el calculo del tamano muestral, una de las altemativas 
consiste en realizar una Encuesta preliminar o piloto. 


Recordemos que en la Asignacion igual , el numero de unidades es igual para cada uno de los es- 
tratos muestrales. En la encuesta preliminar de 14 familias, esta fue la razon por la cual se distribuyo un 
total de (5) cinco familias para cada estrato; en cambio en la Asignacion proportional, las 14 unidades se 
distribuyen en la muestra en la misma proporcion como se distribuyen en la poblacion. 

El peso relativo sigue siendo: 


W = 


N, 


162 




N 355 


= 0,46 


132 


W ~ N ~ 355 


= 0,37 


w = —- 
"s N 


61 

355 


= 0,17 


W x + W 2 +W 3 = 0,46 + 0,37 + 0,17 = 1 


LtV= 1 6 100 

h 


Los anteriores resultados, seran utilizados para calcular los tamanos de la muestra en la encuesta 
preliminar, para cada uno de los estratos: 


7 



n 

5 

15 

■=0,47 => 

ii 

sT 

w 2 = - 

2 n 

= ^ =0,33 => w 2 =W 2 

3 

15 

= 0,20 => 

ii 

sT 

Zw, 

h 

= w i + w 2 + w 3 = 1 0 100 


En esta forma se tendra que el peso relativo en la muestra debera ser igual al de la poblacion: 
^=77^=14(0,46) = 7 n 2 =nW 2 =W(0,37) = 5 /? 3 =/7^F 3 =14(0 / 17) = 3 

Las diferencias que resultan de las operaciones anteriores, se deben a las aproximaciones realizadas 
para calcular los tamanos muestrales en cada estrato, pero de todas maneras deberan considerarse como 
iguales. Las diferencias presentadas carecen de importancia. 

Una vez determinados los tamanos muestrales para la Encuesta preliminar, se procede a la seleccion 
de las unidades requeridas, que permitiran obtener informacion y asi calcular las varianzas y el error: 
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Encuesta preliminar - Asignacion proporcional 


Estrato I 


No. de 

ORDEN 

No. 

ALEATORIO 

INGRESOS 

MENSUALES 
(Miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 

DE CARNE 

DIARIO Grs. 

Total 

Masc. 

Fem. 

Trabajando 

1 

086 

1.630 

si 

3 

2 

1 

1 

605 

2 

151 

1.230 

no 

3 

2 

1 

1 

605 

3 

008 

790 

si 

2 

0 

2 

1 

680 

4 

122 

1.260 

no 

4 

2 

2 

1 

520 

5 

076 

1.260 

no 

3 

1 

2 

1 

516 

6 

024 

840 

si 

4 

2 

2 

1 

610 

7 

055 

1.020 

no 

1 

1 

0 

1 

530 


Estrato II 


No. de 

ORDEN 

No. 

ALEATORIO 

INGRESOS 

MENSUALES 
(Miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 

DE CARNE 

DIARIO Grs. 

Total 

Masc. 

Fem. 

Trabajando 

1 

129 

2.060 

si 

1 

1 

4 

2 

780 

2 

063 

1.860 

no 

1 

2 

1 

2 

586 

3 

015 

2.250 

si 

1 

3 

2 

2 

852 

4 

039 

1.720 

si 

2 

4 

2 

2 

580 

5 

111 

2.050 

si 

2 

5 

2 

2 

734 


Estrato III 


No. de 

ORDEN 

No. 

ALEATORIO 

INGRESOS 

MENSUALES 
(Miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 

DE CARNE 

DIARIO Grs. 

Total 

Masc. 

Fem. 

Trabajando 

1 

03 

3.060 

si 

5 

4 

1 

3 

804 

2 

28 

2.960 

no 

5 

2 

3 

3 

548 

3 

11 

2.890 

no 

4 

2 

2 

2 

770 


Con la informacion anterior respecto a la variable Ingresos (miles de $), calculamos el Tamano 
optimo. Tambien se hara con la caracteristica Propietarios de vivienda, unicamente con el fin de aplicar 
las formulas respectivas. 

Los promedios y varianzas para los ingresos en cada estrato son: 
x = 1.147,14 x 2 = 1.988 x 3 = 2.970 ^=83.923,81 5^=41.470 ^=7.300 

La media ponderada sera: 

x= ^W h x h = 0,46(1.147,14) + 0,37(1.988) + 0,17(2.970) = 1.768,17 
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El error de muestreo con un 5% sera igual a: 
E = 0,05(x j? ) = 0,05(1.768,17) = 88,41 


La primera aproximacion para n sera 


'LW,S; 

_ _ h h 

H ~ (E/Z) 1 


0,46(83.923,81) + 0,37(41.470) + 0,17(7.300) 
(88,41 1,96) 2 


27,13 


n = 


27,13 


1 + 


27,13 

355 


26 amilias 


N7ZL W h S 2 h 

Tambi n mediante la ormula: n = Se ,cnt * ni 9 ue: 

h h 


355(1,96) 2 0,46(83.923,81) + 0,37(41.470) + 0,17(7.300) 

” = 355(88,41) 2 + 1,96 2 0,46(83.923,81) + 0,37(41.470) + 0,17(7.300) 


= 26 amilias 


Veamos ahora, como seria el calculo Tl en una Proporcion. Para ello consideramos como caracteris- 
tica cualitativa las familias propietarias de vivienda; para este caso, se establece una confianza del 95% 
y un error del 10%. 

Pi=~Y = 0,43 P 2 = ~Y = 0-8 jc 3 =-^- = 0,33 


^ W kPk9k 


n = 


0,46(0,43)(057)+0,37(0,8)(0,2)+0,17(0,33)(0,67) 


(E/Z) 2 


n = 


n = = 66 amilias 

° n 80,49 

355 

Tambi n mediante la aplicacion de 


(0,10 1,96) 2 


n - NE 2 +Z 2 E Wpq 


= 80,49 


n = 


h^h^h 

355(1,96) 2 0,46(0,43)(0,57) +0,37(0,8)(0,2) +0,17(0,33)(0,67) 
355(0,10) 2 +1,96 2 0,46(0,43X0,57) +0,37(0,8X0,2) +0,17(0,33X0,67) 


= 66 amilias 


En el tema anterior, para la estimacion de promedios y totales por el metodo de la Asignacion igual , 
se habia supuesto que el tamano de la muestra era de 36 familias. En el caso de la Asignacion propor¬ 
tional , tambien consideraremos que Yl sigue siendo igual a 36. Los tamanos muestrales para cada estrato 
seran: 


n = nW x = 36(0,46) = 17 familias Tl = nW 2 = 36(0,37) = 13 familias 

n = nW 3 = 36(0,17) = 6 familias n = 36 familias 

Determinados los tamanos muestrales para cada estrato, seleccionamos aleatoriamente las unidades 
para la muestra, con lo cual se obtiene la informacion necesaria, para explicar los diferentes metodos de 
estimation puntual y de intervalos. 
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Muestra de asignacion proporcional 


Estrato I 


No. de 
ORDEN 

No. 

ALEATORIO 

INGRESOS 
MENSUALES 
(Miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 
CARNE 
DIARIO Grs. 

Total 

Masc. 

Fem. 

Trabajando 

1 

063 

1.350 

no 

2 

2 

0 

1 

638 

2 

160 

1.240 

no 

2 

2 

0 

1 

580 

3 

124 

1.010 

no 

4 

1 

3 

1 

520 

4 

008 

790 

si 

3 

1 

2 

1 

620 

5 

096 

1.130 

si 

6 

2 

4 

1 

700 

6 

110 

850 

no 

4 

1 

3 

1 

520 

7 

073 

890 

si 

3 

2 

1 

1 

520 

8 

037 

1.260 

no 

3 

1 

2 

1 

580 

9 

021 

1.060 

no 

3 

1 

2 

1 

730 

10 

056 

950 

si 

2 

1 

1 

1 

578 

11 

116 

1.080 

si 

4 

1 

3 

2 

716 

12 

141 

950 

si 

2 

1 

1 

1 

520 

13 

003 

1.080 

no 

3 

2 

1 

1 

735 

14 

018 

860 

no 

1 

0 

1 

1 

510 

15 

076 

1.260 

no 

3 

1 

2 

1 

516 

16 

020 

950 

no 

3 

1 

2 

1 

620 

17 

133 

990 

si 

3 

1 

2 

1 

512 


Estrato II 


No. de 
ORDEN 

No. 

ALEATORIO 

INGRESOS 
MENSUALES 
(Miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 
CARNE 
DIARIO Grs. 

Total 

Masc. 

Fem. 

Trabajando 

1 

006 

2.350 

si 

3 

2 

1 

3 

732 

2 

091 

1.830 

si 

3 

0 

3 

2 

636 

3 

121 

2.180 

no 

5 

2 

3 

3 

687 

4 

034 

2.020 

si 

3 

1 

2 

2 

680 

5 

130 

1.650 

no 

2 

0 

2 

1 

530 

6 

115 

1.920 

si 

5 

3 

2 

2 

732 

7 

081 

2.150 

no 

3 

1 

2 

2 

613 

8 

075 

1.960 

si 

2 

1 

1 

1 

642 

9 

008 

2.000 

si 

3 

1 

2 

1 

804 

10 

100 

2.260 

si 

2 

1 

1 

2 

712 

11 

019 

1.760 

si 

3 

1 

2 

2 

880 

12 

023 

2.140 

si 

5 

2 

3 

3 

540 

13 

035 

1.930 

si 

4 

2 

2 

2 

520 


Estrato III 


No. de 
ORDEN 

No. 

ALEATORIO 

INGRESOS 
MENSUALES 
(Miles $) 

PROPIEDAD 

VIVIENDA 

NUMERO DE PERSONAS 

CONSUMO 
CARNE 
DIARIO Grs. 

Total 

Masc. 

Fem. 

Trabajando 

1 

31 

3.210 

no 

4 

2 

2 

2 

806 

2 

42 

2.960 

no 

3 

1 

2 

2 

684 

3 

53 

3.460 

si 

4 

1 

3 

3 

718 

4 

20 

3.870 

no 

4 

1 

3 

2 

735 

5 

06 

2.600 

si 

4 

2 

2 

2 

752 

6 

38 

2.990 

no 

4 

2 

2 

2 

755 
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Estimation de promedios y totales 


Para este metodo, unicamente se calculara el estimador del promedio y del total de ingresos por familia, 
dejando al lector la aplicacion de formulas para hallar promedio de personas por familia y consumo 
diario de came (en gramos), toda vez que el proceso es similar al utilizado en la Asignacion igual. 


Las Medias aritmeticas y Varianzas del Ingreso (en miles de $) por familia son: 


Xj = 1.041,18 

x 2 = 2.011,54 

x 3 = 3.181,67 

5^=26.611,03 

s\ = 40.430,77 

s 3 = 195.256,67 

s 1 = 163,13 

5 2 = 201,07 

s 3 = 441,88 

n x = 17 

n 2 = 13 

= 6 


El es ima i o pun ual seobtieneasi: 

x st = 'LW h x h = 0,46(1.041,18) +0,37(2.011,54) +0,17(3.181,67) = 1.764,10 
EI estimador de la varianza para el calculo del error de esti macion sera: 


V f = 


*st ^2 


- n 


h' n 7 


162(162 i 7 ) 26.611,03 +132(132 13) 40.g,77 + 61(61 6) 195.256,67 =1 545 75 


17 


13 


*st 


&M 1.545,76 =39,32 


y lOS limites de confianza del 95 para el promedio'. 

yi 1.844,02 = 


Kr K, x s ts = 1-764,10 + 2,035(39,32). 

i i >4 


v = n 1 + n 2 + n 3 3 = 17 + 13 + 6 3 = 33 


1.684,08 = 


1.844.016,2 

1.684.083,8 


Siendo: a = 0,05, se tendra que el valor de t = 2,035 


Para el total estimado se tiene: 


X st = Nx st tNs k „ X st =355(1.764,10) 2,035(355)(39,32) 


i.st st, 




654.661,25 (miles ) 
597.849,75 (miles ) 


Se estima que el Ingreso total de las 355 familias sera aproximadamente de $ 626.255.500 y que el 
verdadero total estara entre $ 597.849.750 y $ 654.661.250 con una seguridad del 95%. 


749 
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Estimacion de proporciones y totales 

Consideramos como ejemplo la caracteristica cualitativa: Propiedad de la vivienda, para estimar la 
Proporcion y el Total de propietarios, fijando limites de confianza del 95%. Se tendra: 

7 10 2 

=— = 041 = — =077 =—=033 

i 17 2 13 u ’ '' 3 6 

s =L s = 0,46(0,41) + 0,37(0,77) + 0,17(0,33) = 0,5296 = 52,96 


Se estima que el 52,96 de las amilias son propietarias de vivienda. 


1 


£ ( n )- 


1 162(162 17) 04 +132(132 13) Q 77 ® 2 ® +61(61 6)^^^ =0,006 


"355 2 


13 


= 0,5296 2,035 Jo,006 

V X 


68,72 


37,20 


Entre 37,20% y 68,72% debera estar el verdadero porcentaje de familias Propietarias de vivienda. 
Para calcular el Total de familias propietarias de vivienda, se tendra. 


-Np st tN^ 


'=355(0,53) 2,035(355) J 0,006 

i 1 N* 


244,11=244 

132,19=132 


Familias 


Se estima que en total, 188 familias son Propietarias de vivienda y el verdadero valor estara entre 
132 y 244 familias, con una confianza del 95%. 


Estimacion de proporciones y totales en conglomerados 

Como en los metodos anteriores, consideraremos el estimador de la Proporcion en mujeres. 

'La h . a. = Total mujeres en la muestra 

P ~ - 

h Em*. m. = Total de personas (hombresy mujeres) en la muestra 


o 

m 

II 

W 

£a 2 = 26 

£a 3 = 14 

Em, = 51 

X/77 2 = 43 

X/77 3 = 23 

EaJ = 72 

£a 2 = 58 

£a 2 = 34 

Em 2 = 173 

Em 2 = 157 

Em 2 = 89 

£< 2 , 77 ?,= 107 

Ha 2 m 2 = 92 

Ha 3 m 3 = 54 

m 1 = 3 

m 2 = 3,31 

m 3 = 3,83 

« 1 = 17 

n 2 = 13 

n 3 = 6 

p 1 = 0,59 

p 2 = 0,60 

p 2 = 0,61 
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El estimador de la varianza o error de estimacion estara dado por: 


- v (1 ) Za 2 2 Za . . + 2 Z 2 . 

= Z - -*-i—*- 1 

s n ~ 2 1 n 1 


✓s 


162 72 2(0,59)(107) + 0,59 2 (173) 1 132 58 2(0,60)(92) + 0,6 2 (157) 

17(9) 17 1 + 13(10,96) 13 1 


1 6 

1 “6T 34 2(0,61)(54)+0,61 2 (89) 
6(14,67) 6 1 


= (0,00585)(0,3726) + (0,0063)(0,3433) + 0,0102(0,2474) = 0,0069 

s 

= L = 0,46(0,59) + 0,37(0,6) + 0,17(0,61) = 0,597 = 0,60 


= 0,60 2,035 


0,0069 




0,77 = 77 


0,43 = 43 


Se estima que el 59.7% (aproximadamente el 60%) de las personas son mujeres y el porcentaje 
verdadero debera estar entre 43% y el 77%. 

Como no conocemos el total de personas en las 355 familias, se podra realizar el estimador de tota- 
les, si establecemos una cifra de 1.093 personas, obtenido de la siguiente manera: 

M =355(3,08) =1.093 3,08 =Promediode personas por amilia 355 = Total de amilias 


, = 1.093(0,6) 2,035(1.093) i 0,0069 . 

i I >4 


^,840,56=841 


Personas 


471,04=471 


Aproximadamente 655 son mujeres, pero el verdadero valor estara entre 471 y 840 con una segu- 
ridad del 95%. 


Estimacion indirecta del promedio y el total a traves del metodo de la razon 

En este caso, al igual que en la Afijacion igual, la estimacion de la Razon se puede hacer por cualquiera 
de los metodos, ya sea separada o combinada. 


a. En el metodo Razon Separada, se procede de la siguiente manera: 


'Lx, 


donde: 


Si trabajamos con la informacion obtenida a traves de la muestra correspondiente a las 36 familias, 
se tendra; 

“ 1 = 1,76 - 2 = 2,0 " 3 =2,33 Xj = 1,24 x 2 = 1,31 x 3 = 1,5 
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La variable Y la utilizamos para simbolizar al atributo mujeres y la X a la caracterlstica hombres, 
por lo tanto la razon a calcular sera mujeres/hombres. 


1,76 


= 1,42 


2,0 


= 1,53 


2,33 


= 1,55 


1 1,24 ' 2 1,31 ' 3 1,50 

s = T,W h h = 0,46(1,42) + 0,37(1,53) +0,17(1,55) = 1,48 por cada 2 hombres hay 3 mujeres. 
Para el estimador de la varianza para calcular el error de estimacion, se tiene: 

= £ -2 s 2 2 p s s x + ~ 2 s 2 x 

s n h X h h h^h h X h h X h 


Los valores para p (rho) son: 

_ d n _ 0,45 

Pl "2 d "2(0,62) 

1 


Pi = 


d x, 0,65 


2 "2 d "2(0,36) 

2 


= 0,90 


ft a 

3 

2(0,22) 0,84 



Siendo: 




I— 1 

II 

- U4 = 0 ' 45 

V 1,31 = 0,65 

, 0,55 n , 7 
dx 3 1,5 0,37 

d=^ 

i 

’ 1J6 = 0 ' 62 

0 71 

+=2,0 = 0 ' 36 

0 52 

+=2,33= 022 

Las racciones de muestreo: 

1_ 162 " 0,1 ° 

2 = 0,08 3= 0,10 


Con la anterior informacion se podra calcular el estimador de la varianza para el calculo del error: 


1 0.10 

17(1,54) 


1,19 2(1,42)(0,36)(0,56)( 1,09) + 1,42 2 (0,32) + 


1 0.08 

13(1,72) 


0,50 2(1,53X0,9X0,71)(0,85) + 1,53 (0,73) + L-M) 0 ,27 2(1,55) 

6(2,25) 

(0,84)(0,55)(0,52) + 1,55 2 (0,30) =0,0805 

Lfmites del 95 para el estimador: 


1 


=1,49 2,035 


10,0805 




2,07 = 2 hombres 
091 =1 hombre 
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Se estima por cada 3 mujeres hay dos hombres. 
b. En el caso de la razon combinada ( ), se tendra que: 

x st =^W h x h = 0,46(1,24) +0,37(1,31) +0,17(1,5) =1,31 

"*=0-46(1.76) +0,37(2,0) +0,17(2,33) =1,95 

Siendo: " =^- = ifr = 1 ' 49 


El estimador de la varianza 
para el calculo del error 


v = z 


(1 


n,x} 

h h 


OS x s 

h h h 


+ 


k 2 


<> _ i o.io 

V ~~ 17(1,54) 


1,19 2(1,49)(0,36)(0,56)(1,09) + 1,49 2 (0,32) + 


1 0,08 

13(1,72) 


0,5 2(1,49)(0,9)(0,71)(0,85) + 1,49 2 (0,73) + 1 ^ 0,27 2(1,49) 
(0,84)(0,55)(0,52) +1,49 2 (0,30) =0,0781 


Estimacion indirecta del promedio y total mediante la regresion lineal 

La estimacion del promedio cuando fue realizada mediante la Asignacion igual , consideramos dos 
caracteristicas para la aplicacion del metodo de la Regresion lineal , consumo de carne diario en gramos 
(Y) e ingreso familiar (X). Recordemos que se usaron dos procedimientos de calculo, el separado y el 
combinado. 

Ahora seran aplicados, en la Asignacion proporcional en la misma forma, como se utilizaron para 
la Asignacion igual. 

Veamos los resultados que se obtendrian en la Asignacion proporcional. 

Z( .-)(*,.*) n Z X (Zx )(Z ,) 

= " + ( ~x ) = ----- = --—---- - 

X(x . x ) 2 n Hx 2 . (Xx ,) 2 

Para el reemplazo de estas formulas, tomaremos los resultados obtenidos mediante la muestra de 
las 36 familias, donde: 

Se podra calcular de la siguiente manera: 


M 

s- 

n iAiT h 

h h h 

* 

2 

n ex , 

h h 


El promedio estimado, en la re resi n lineal separada se obtiene asi: 


- = X 

s 


h 


h 


A 


5 - S 

i 


1 


y sus lfmites de con ianza 


V- 
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El estimador de la varianza 
para el calculo del error 

m xm = Se denomina covarianza y se puede calcular de varias maneras, como por ejemplo 


= £ 


2 (1 ) 


+ V 


m x = r.s s , siendo r. el coe iciente de orrela i n en cada estrato. 

hh hx h 




h r h 

\ 

vxJ 2 ^ i „> 2 


Directamente la Covarianza se calcula: m, =- 


h h 


nXx h . (X„)(X 


m x - 

x h h 


n l 


La aplicacion de estas formulas, trabajando con las variables ingresos (x) y consumo de carne diario 
(y), es como sigue: 

Se obtiene en primer termino, la informacion necesaria de los tres estratos, en la muestra de 36 
familias: n = 17 n = 13 n = 6 

Estrato I 


&1 =163,13 

5 X 2 = 26.611,03 

i 

X*! != 10.590.720 

q= 1.041,18 

Xr^ 17.700 "j= 595,0 

Xr 2 = 18.854.600 

5 j= 82,98 

5^=6.886,5 = 10.115 

X^ 2 = 6.128.609 

j = 0,1390 

/- = 0,27 ^=17 



Estrato 11 


3c 2 =2.011,54 

5 = 201,07 5 2 = 40.430,77 Xx = 26.150 

A 2 ^ 

Xx 2 = 53.086.900 

Zx 2 2 = 17.536.670 ' 2 = 669,85 5 2 = 106,49 

s\ = 11.340,47 

X 2 =8.708 

X 2 = 530.086.900 2 = 0,0416 r 2 = 0,0785 n= 13 

Estrato III 



*3=3.181,67 

S x =441,88 5 2 =195.256,67 Xx = 19.090 

3 3 3 

Xx 2 = 61.714.300 


Xr 2 = 14.153.280 - =741,67 5=40,87 

3 3 3 3 

5 2 =1.670,67 

3 


X 3 = 4.450 

X J= 3.308.770 3 = 0,005261 r= 0,057 « 3 =6 
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Calculo de los Coeficientes angulares: 

17(10.590.720) (17.700X10.115) 

,= —-—--=0,1390 

1 17(18.854.600) (17.700) 2 

13(17.536.670) (26.150)(8.708) 
o— -i— —0,0416 

2 13(53.086.900) (26.150) 2 

_ 6(14.153.280) (19.090X4.450) = Q0()53 
3 6(61.714.300) (19.090) 2 

Ahora se obtendran los valores de y 

" =595,0 + 0,1390(1.080 1.041,18) = 600,40 

1 

' =669,85 + 0,0416(1.850 2.011,84) = 663,13 

2 

= 741,67 0,0053(3.220 3.181,67) = 741,47 gramos de consumo de came diario. 

3 

El promedio estimado mediante la regresion lineal separada sera: 

0,46(600,40) +0,37(663,13) +0,17(741,47) =647,59 gramos de consumo. 

Para hallar el estimador de la varianza, para los llmites de confianza, del 95%, se debe calcular en 
primer lugar, la covarianza para cada estrato: 


10.590.720 

m x\y\~ Yl 


1.041,18(595,0) =3.481,43 



(2.011,54)(669,85) =1.544,55 



(3.181,67X741,67) = 869,19 


Ahora, el estimador de la varianza para el calculo del error de estimacion se obtiene mediante la 
formula: 



p _ 0,46 (1 0,1) 

y RL s 17 


6.886,5 2(0,1390)(3.481,43)+0,1390 2 (26.611,03) + 0,372 j 1 . Q|8> 


11.340,47 2(0,0416X1.544,55)+0,0416 2 (40.430,77) + 


0,17 2 (1 0,10) 


1.670,67 2( 0,0053)( 869,19)+( 0,0053) 2 (195.256,67) =188,59 
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Los limites de confianza del 95% para el promedio de consumo de carne diario (grs) 




677,54 


Yrl = 649,59 2,035 -I 188,59 ^ Consumo promedio de came diario en gramos. 


^ IOO,J7 


621,64 


Mediante el empleo del metodo de la regresion lineal combinada, el promedio estimado de consu¬ 
mo de came diario (en gramos) por familia es: 

y st = 'LW l y h y s = 0,46(595,0) +0,37(669,85) +0,17(741,67) =647,62 

x st = ZW h x h x t = 0,46(1.041,18) +0,37(2.011,84) +0,17(3.181,67) =1.764,21 

El coeficiente angular combinado se obtiene: 


b= YLW h b h b= 0,46(0,1390) + 0,37(0,0416) + 0,17( 0,0053) = 0,0784 

Siendo: 

f RLc = -y si + b c [XW xj L, = 647,62 +0,0784(1.729 1.764,21) =644,85 

El estimadordelavarianza para el error deestimacion sera igual a: 

w ]d /j n 

V- = I —^^ 2 b m xv + b 2 s} 

yjlL 11 u Vr c x 7 y 7 c x 7 


v >» 


= 0,4620,1) 6.886,5 2(0,0784)(3.481,43) + 0,0784 2 (26.611,03) + 0,372 [3 0,8) 


11.340,47 2(0,0784)(1.544,55) +0,0784 2 + (40.430,77 + MZiMIO) 


1.670,67 2(0,0784)( 869,19) + (0,0784) 2 (195.256,67) =192,92 


?RL = 644,85 2,035 Jl92,92 ^ 

c 1 


673,12 

616,58 


Consumo promedio de carne diario en gramos. 


Como en el caso de la asignacion igual , se pueden realizar estimativos indirectos para el total; en 
este caso, consideraremos el total consumo de carne diario (en gramos) para las 355 familias del barrio 
investigado. 


§ 

£ 

II 

y\ 

VyRLs 


Lc = ^ c tN ] 

i 



7^ = 355(649,59) 

i 


Yru= 355(644,85) 

i 


2,035(355) 


-Jl88,59 


2,035(355) 


-Jl92,92 


240.525,32 
^ 220.683,53 
^ 238.955,92 
218.887,58 
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ASIGNACION OPTIMA 

El calculo de la muestra dependera en muchos casos del costo total de la investigacion (C), del costo fijo 
(C o ) y del costo unitario (C h ); este ultimo podra ser fijo o variable , para cada uno de los estratos, ademas, 
el grado de variabilidad (S 2 ). En conjunto, los anteriores factores determinaran con mayor precision el 
tamano optimo de la muestra; sin embargo, ademas de los factores anteriores, podran considerarse como 
elementos complementarios, el margen de error y el grado de confianza. 

Las formulas, dependeran de los factores que se disponga o sean considerados para determinar el 
calculo del tamano muestral, con el fin de lograr una mejor asignacion de unidades dentro de la muestra, 
en busca de mayor precision que en la practica, algunas veces, es sacrificada, mediante la aplicacion de 
otros metodos mas simples, pero que arrojan resultados comparativamente tan seguros como los obteni- 
dos mediante la Asignacion optima. 

En sintesis, el metodo de Asignacion o Afijacion optima se reduce: 


a. A una optima distribucion del tamano de la muestra entre los diferentes estratos, de 
tal manera que el error de estimacion sea minimo para un costo total dado. 

b. Ademas, un costo total minimo para un error preestablecido, en algunos casos, se 
aplica el grado de variabilidad en cada estrato, combinado con los costos unitarios 
(fijos o variables) y los tamanos poblacionales de cada estrato. 


Tamano de la Muestra 


Se usan varias formulas, de acuerdo a los factores que se tomen en cuenta para su obtencion. Se veran 
algunos de tales procedimientos: 


a. En el caso de que tan solo se consideren como factores para el calculo de n , el costo total de 
la investigacion (C), el costo fijo (Co) y el costo unitario por estrato (Ch), se debe aplicar la 
siguiente formula: 



Por ejemplo, si se tiene: C = $ 350.000 C o = 250.000 C h = $ 4.000 


El tamano de la muestra sera: 


350.000 250.000 
4.000 


= 25 amilias de una poblacion de 355. 


En esta formula no se tienen en cuenta componentes o factores tan importantes como el grado de 
variabilidad (varianza) de la caracteristica en cada estrato, tamanos de los estratos, nivel de confianza y 
nivel de error. 


Como en este ejemplo, el costo unitario (C h ) es constante para cada uno de los estratos, los respec- 
tivos tamanos muestrales para el promedio se obtendran asi: 
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6 

En el caso de proporciones , las formulas a aplicar seran: 

6 

Si consideramos los resultados obtenidos a traves de la encuesta preliminar de las 15 familias, 
mediante el metodo de Asignacion proporcional a fin de no repetir el proceso de seleccion y calculo, la 
varianza de los ingresos y las proporciones de familias con vivienda en cada estrato, seran: 

^ = 83.923,81 ^2 = 41.470 s] = 7.300 

Las proporciones de amiliascon vivienda: ^=0,43 p 2 = 0,8 p 3 = 0,33 

Siendo los tama os en cada estrato: ^=162 N 2 =132 A^ = 61 setendra que: 





n, = n 

h 


W A 

^AA 


n= 25 


162 H 83.923,81) 


= 25 


46.930,76 


162f8192X81 +132 (4L470 + 61 ([7300 46.930,76+26.880,72 +5.211,98 


= 15 amilias 


26.880,72 

n= 25 .. , r =8,5=9 amilias 

2 79.023,46 


5.211,98 

79.023,46 


= 1,65=2 amilias 


n — n 3 + n 2 + n 3 — 15 + 9 + 2 — 26 amilias 


En las proporciones, utilizando como ponderaciones a W se tendra que: 


n =25 


n,= 25 


0,46 (1 0,43(0,57)) 


0,46 )|0,43(0,57)+0,37 f0M2)+0,17 ^ 0,33(0,67) 
0,148 


= 25 


0,2277 


= 8 amilias 


0,4556 

n= 13 + 8 + 5 = 26 familias 


=25 


0,2277+0,148+0,0799 
0,0799 


= 15 amilias 


0,4556 


= 5 amilias 


b. Otra formula para determinar el tamano optimo de la muestra, disponiendo de informacion sobre 
el costo total de la investigacion (C), costo fijo (C o ), grado de variabilidad de cada estrato 
(S h ), costos unitarios (C h ) que pueden ser constantes o variables para cada estrato y el tamano 
poblacional de cada estrato (N h ). 

Los anteriores factores permiten determinar el tamano Yl con mayor representatividad que la obte- 
nida con la formula anterior, ya que ademas de los costos, se tienen en cuenta los tamanos poblacionales 
de los estratos, y el grado de variabilidad para cada uno de ellos. 
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Si consideramos la siguiente informacion tomada de la encuesta preliminar; Asignacion proporcional 


s = 289,70 

S 2 = 203,64 

5 3 = 85,44 

N= 162 A^ 2 = 132 7^=61 

C= 4.000 

C = 4.000 

C = 4.000 

C= 350.000 C = 250.000 


3 

O 


Se tendra que Tl sera igual a: 

162(289,70) | 132(203,64) | 61(85,44) j 

{4000 {4000 flOM ' 

n= - . - , - . =24 amilias 

162(289,7) 14.000 +132(203,64) {4000+61(85,44) {4000 

Puede observarse que hemos utilizado costos unitarios (C h ) constantes, en la formula anterior. 


350.000 250.000 


Coincidencialmente se obtuvo un resultado igual a la anterior formula; sin embargo el valor de Tl 
puede ser mayor o menor, dependiendo del grado de variabilidad y tamano de cada estrato. Supongamos 
ahora que los costos unitarios (C h ) para cada estrato son variables: 

C = 2.000 C = 3.000 C 3 = 4.000 

Por lo tanto el valor de Tl sera: 


162(289,70) | 132(203,64) | 61(85,44) | 
{ZOOO {loop {4000 ' 

162(289,7) )| 2.000 +132(203,64) 13.000 + 61(85,44) {4000 


350.000 250.000 


= 42 amilias 


(Nota: setrabajoen la calculadora con el programadeestadistica). 

En el caso de que C h sea constante, los tl h se obtienen mediante las ormulas: 


n, = n 

h 


N h S h 

™ h S h 



Para cuando C h es variable para cada uno de los estratos, los tl h se calcularan asf: 



N h S h ' 


W h s h ' 


n„=n 

{^ 

6 n=n 

h 

W 



W h s h 













Siendo : n x n 2 n 3 lostama os muestrales en cada estrato, estos seran igual es a: 


162(289,7) 

{Z000 

162(289,7) 132(203,64) 61(85,49) 

{2 M0 {TM0 {4000 
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= 27,16 = 28 amilias 
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n 2 = 42 


490,77 


1.622,64 


= 12,71 = 13 amilias f) = 42 


82,45 


1.622,64 


= 2,13 = 3 amilia 


n = 27 + 13 + 3 = 43 amilias 

Si la caracteristica es cualitativa, utilizamos proporciones como en el caso de estimar las proportio¬ 
ns de familias propietarias de vivienda. El procedimiento es similar al anterior, tan solo se reemplaza 
a s 2 por s 2 =pq y se tendra que: 


(C - Co) | 

n - 

N 

p h Q\ l 

q 1 

1 



Siendo: 

350.000 250.0001162 

n=- 


0,43(0,57) 


4.000 


+132 


0 , 8 ( 0 , 20 ) 

4.000 


+61 


0,33(0,67) 

4.000 


162 ^0,43(0,57)^4.000+ 13210,8(0,2)^4.000+61^0,33(0,67^4.000 

Si los C h varian para cada estrato, se tendra: 


= 25 amilias 


350.000 250.000 162 


n = 


0,43(0,57) 


2.000 


+132 


0 , 8 ( 0 , 20 ) 

3.000 


+61 


0,33(0,67) 

4.000 


= 39 amilias 


16210,43(0,57) 12.000 +13210,8(0,2)13.000 + 6110,33(0,6714.000 

Para calcular los tamahos muestrales en cada estrato, cuando C h es variable se procedera asi: 


n =n 


-1 

p h Q h 

q 


KQ h 

\ q J 


n=n 

n 


i_ 

P „Q„ 

q 

2^1 

S J 


Reemplazando se tendra: 


n= 39 


0,46 


0,43(0,57) 

2.000 


0,46 


°- 43 (°- 57 ) +0,37 
2.000 


0 , 8 ( 0 , 20 ) n , 7 

2.000 


= 22 amilias 


n 2 = 39 


0,00270 

0,00905 


= 12 amilias 


n = 39 


0,33(0,67) 
4.000 . 

0,00126' 
0,00905 


= 6 amilias 


El incremento que presenta el valor de Tl se debe a las aproximaciones, siendo preferible en nume- 
rosas ocasiones tomar una unidad de mas, que una de menos. 
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c. El tamano optimo de la muestra, en el muestreo aleatorio estratificado , por el metodo de 
asignacion optima , tambien se puede obtener utilizando el nivel de confianza, el error de 
muestreo y el costo unitario (C h ) para cada estrato, mediante la formula: 






+ —2l¥S 2 

N h h 



Dado que los C h pueden ser constantes o variables, utilizaremos la formula y los datos anteriores, 
con una confianza del 95,5% (Z = 2) y un error del 5% para el promedio y del 10% para el atributo, 
para calcular U. Veamos cuando C h es constante. 


0,46(289,7) aR^ 000+0,37(203,64hp00 +0,17(85,44) 


n = 


0,46(289,7) | 0,37(203,64) | 0,17(85,44) 


i 4.000 j 4.000 ^4.000 


[88,411 2 1 

1 2 / + 355 


= 24 amilias 


0,46(83.926,09)+0,37(41.469,25)+0,17(7.300) 


(Nota: se trabajo en la calculadora con el programa de estadlstica). 


El anterior resultado de 24 familias corresponde al tamano optimo para calcular el estimador del 
promedio de ingresos por familia. Veamos ahora que sucede, cuando C h es variable: 


0,46(289,7)jZ000+0,37(203,64hH000 +0,17(85,44){4M 


n = 


0,46(289,7) { 0,37(203,64) | 0,17(85,44) 


2.000 \ 3.000 ^4.000 


88,411 2 


= 25 amilias 


2 I T 355 


0,46(83.926,091+0,37(41.469,251+0,17(7.300) 


En el caso de estimativos para proporciones, la formula aplicada para determinar el tamano optimo 
de la muestra corresponde a: 


El 2 


En la anterior formula como en el caso anterior C h puede ser constante o variable. Con los datos 
que hemos obtenido a traves de la encuesta preliminar, reemplazamos en la formula anterior, cuando C h 
es constante. 



n = 


0,46\|0,43(0,57){4000 + 0,374 0,8(0,2){4000 + 0,17i| 0,33(0,67) {4000 


[°' 10 | 2 | 1 

1 2 I + 355 


0,46(0,43)(0,57)+0,37(0,80X0,20) + 


(contin a) 


0,46 


0,43(0,57) 

4.000 


+ 0,37 


0 , 8 ( 0 , 20 ) 

4.000 


+ 0,17 


0,33(0,67) 

4.000 


+ 0,17(0,33)(0,67) 


= 67 amilias 
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En el caso de que C h sea variable se tendra: 


n = 


0,46 


A 0,43(0,57) A 

2.000 + 0,37 A 

0,8(0,2) A 

3.000 + 0,17 A 

0,33(0,67) A 



0,46(0,43)(0,57)+0,37(0,80)(0,20) + 


(contin a) 


0,46 


0,43(0,57) 


2.000 


+ 0,37 


0 , 8 ( 0 , 20 ) 


3.000 


+ 0,17 


0,33(0,67) 


4.000 


+ 0,17(0,33)(0,67) 


= 68 amilias 


Es necesario anotar que en esta formula se puede prescindir de los costos unitarios (C h ) cuando 
estos son constantes para cada estrato y, por tal razon, se obtiene una formula mas simplificada, que nos 
permite calcular el tamano de la muestra en una forma mas sencilla, veamosla: 


n _ (^A ) 2 

b. 


-Iff 



+ N 


+ N 



Reemplazando los datos que ya tenemos, en las formulas anteriores se obtiene: 


a. n 


0,46(289,7) +0,37(203,64) +0,17(85,44) 2 


1 88,4l) 2 , 

0,46(83.926,09) +0,37(41.469,25) +0,17(7.300)" 

l 2 l + 

355 


24 amilias 

(variable ingresos) 


b. n 


[ 0,46^0,43(0,57) +0,37^0,8(0,2) +0,17 ^0,33(0,67) f 


o 

I—1 

o' 

0,46(0,43)(0,57) +0,37(0,8)(0,2) +0,17(0,33)(0,67)" 

12/ 

355 


= 68 amilias 

(proporcion propietarios) 


Las diferencias obtenidas con la aplicacion de estas formulas, en relacion con aquellas que tienen 
en cuenta los costos unitarios (C h ), constantes, son pequenas. 

En estos dos casos, los tamanos muestrales para cada uno de los estratos, se pueden calcular me- 
diante las formulas: 


n h = 

" N h S h " 


ZA7.S'. 

n h 






n h = 


w.s, 

h h 


ZW h S k 

h h 


Las anteriores formulas aplican cuando se trata de la estimacion de una variable. En el caso de 
trabajar con atributos , las formulas a aplicar son: 




of 


\ p h Qh_ 



6 
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METODO DE NEYMAN 


Dentro de las tecnicas utilizadas en el Muestreo Aleatorio Estratificado para hallar Tl , puede efectuarse 
el calculo en forma independiente para cada uno de los estratos muestrales; siendo conocido como el 
Metodo de Neyman. 


n 


W h S 2 h WJSl 

h h h h 


°h V 

V h 


E h ' 2 


Siendo: 


n h = 


1 +- 


n 


Oh 


A, 


Es posible en muchos casos, establecer el error para cada uno de los estratos. El procedimiento a 
seguir es: con los datos obtenidos en la encuesta preliminar de 15 observaciones, siendo 


». = 7 


n 2 = 5 


/? 3 = 3 


(asignacion proporcional). 


S 2 0,46(83.926,09) 2? =0 05(1 147 14) = 57 36 

, -- m - 7 -= ZK f)R = dfi familiar A j /,jO 

01 (EjzJ 2 (57,36/1.96) 2 45,08 46 tamilias 


n = 


n r 


n °2= 


‘ 0 l 


45,08 


n, 


1+ # 1+ 


45,08 


= 36 familias 


162 


W 2 s\ 0,37(41.469,25) 

C Ej^) 2= (99,4/1,96) 2 =5,97 

5,97 


" 5,97 


= 5,71 = 6 familias 


1+ 


132 


z,= 1,96 


£ = 0,05(1988) = 99,4 


z = 1,96 


W o 3 = 


IfjS’ 2 0,17(7.300) 

(Ej^) 2 = (148,5/1,96) 2 

0,22 


= 0,22 


£ 3 = 0,05(2.970) =148,5 
z 3 = 1,96 


0,22 


■= 1 familia 


1+ 


n = n x + n 2 + n = 36 + 6 + 1 = 43 familias 


61 


Algo similar ocurre para el calculo de n cuando se desea hacer la estimation de una proportion. 
W h P hQ h 


h h^h 

n n = ^ , , 2 


n °r 


° h_ ( E J z h y 

0,46(0,43)(0,57) 
(0,10/1,96) 2 

0,17(0,33)(0,67) 


= 43,31 


£, = 0,10 £ 2 = 0,10 

0,37(0,8)(0,2) 

(0,10/l,96) 2 


£3 = 0,10 


= 22,74 


n n =- 


(0,10/l,96) 2 


■=22,74 
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n r 


43,31 

i | 43,31 
162 


= 35 


n 2= 


22,14 

i | 22,74 
132 


= 20 


» 3 = 


14,43 


1 + 


14,43 

61 


= 13 familias 


n = n i + n 2 + n 3 = 35 + 20 + 13 = 68 familias 

EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Informacion 
en Linea SIL. 



87. Con los datos de una poblacion: 


Calcular el tamano de la muestra en el estrato I, para 
un nivel de confianza del 95,5% y un desvlo maximo 
tolerado de Ej = 11. Analogamente para el estrato II, con 
Z = 1 =>(63,8%) y E 2 = 12,5. 

88. Calcular los tamanos de muestra para los estratos, aplicando la afijacion proporcional, igual y 
optima, tomando como base el tamano total de la muestra, obtenido en el punto anterior. 

89. Con la siguiente informacion: 


ESTRATO 

W „ 

s„ 

C h 

y h 

n h 

I 

0,5 

4 

1 

10 

200 

II 

0,3 

5 

4 

20 

120 

III 

0,2 

6 

9 

32 

80 


a) Determinar el tamano de la muestra, por el metodo de asignacion proporcional y optima. Error 
del 5% y nivel de confianza del 95%. 


b) Si ademas de la informacion dada, se tiene que C = $10,000 y Co = $9,500, determinar el 
tamano de la muestra, por el metodo de asignacion optima, siendo n = 148. 

90. Con los datos del ejercicio anterior se pide fijar llmites de confianza del 95%, para el estimador del 
promedio y del total, por los metodos de asignacion proporcional y optima, siendo n= 111. 



ESTRATO 

n h 


I 

285 

28 

II 

415 

37 

Total 

700 

- 
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N = 190 N 2 = 80 N 3 = 130 N = 400 

Se pide: 

Considerando que los datos fueron obtenidos mediante una encuesta preliminar, determinar el 
tamano de la muestra (proporcional), con nivel de confianza del 95,5% y error del 5%, para las dos 
variables. 


92. Con los datos del ejercicio anterior, suponiendo que el tamano de la muestra es 15 y los resultados 
son los del cuadro anterior, se pide estimar: 

a) El promedio y el total para la variable X. 

b) Mediante razon combinada y separada, estimar el promedio para la variable Y. 

c) El promedio para la variable Y, mediante el metodo de la regresion (combinada y separada). 
Informacion adicional X = 1,6 X = 5,2 X = 9,6 X = 7,3 

1 7 2 7 3 7 st 7 

93. En una poblacion cuyas caracteristicas son conocidas: 


ESTRATO 




y h 

p „ 

I 

0,45 

4 

2 

16 

0,62 

II 

0,35 

5 

4 

21 

0,54 

III 

0,20 

6 

9 

30 

0,36 


Ademas: 


E = 2,5 Z = 1,96 N = 200 E=12% 


Considere la informacion anterior, para determinar el tamano de la muestra, mediante: Asignacion 
igual, proporcional y optima. Obtener los tamanos muestrales para cada estrato con cada uno de los 
metodos anteriormente dados, tanto para la variable (Y), como para la proporcion. 


94. Con los datos del ejercicio anterior, suponga que Ej = 0,8 E 2 = 1,02 y E 3 = 2 para determinar 
los tamanos de la muestra, de acuerdo al metodo de Asignacion de Neyman. 


95. Con los datos del ejercicio 93, fije los limites de confianza del 95% para el estimador del promedio 
y de la proporcion, mediante los metodos de asignacion igual y optima. 


96. Insatisfaccion de los empleados en su trabajo, puede causar un aumento en los costos de una empresa, 
debido a la baja calidad de la mano de obra y al ausentismo. El gerente esta interesado en determinar el 
numero de dias laborales perdidos por ausencias, incluyendo los de enfermedad y accidentes de trabajo. 
Por razones de tipo administrative, se uso el metodo de muestreo aleatorio estratificado con afijacion 
proporcional para seleccionar una muestra de un total de 700 trabajadores que tiene la empresa. Los 
estratos estaban representados por grupos de obreros, tecnicos y personal administrative. 


Supongamos que la encuesta preliminar arroja 15 obreros, 10 tecnicos y 2 administradores, como 
aparecen a continuacion: 
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Determine el tamano de la muestra, fijando limites con una confianza del 95% y error del 8%. 

97. Suponga que la informacion anterior es el resultado de una muestra, con la cual se pide estimar el 
total de dias perdidos por los empleados de la empresa. 

98. Con los siguientes datos: 


Estrato I 


NUMERO 

DE ORDEN 

NUMERO 

ALEATORIO 

PERSONAS 

SERVICIOS 

INGRESOS 

MENSUALES 
(Miles $) 

Hombres 

Mujeres 

Luz 

Agua 

1 

70 

2 

1 

no 

no 

4.500 

2 

08 

1 

1 

no 

si 

6.000 

3 

36 

0 

2 

no 

si 

5.000 

4 

42 

3 

1 

si 

si 

6.000 

5 

28 

2 

2 

si 

no 

7.000 

6 

16 

1 

3 

no 

no 

5.000 

7 

22 

1 

3 

si 

si 

4.500 

8 

55 

1 

2 

si 

si 

4.800 


Estrato II 


NUMERO 

DE ORDEN 

NUMERO 

ALEATORIO 

PERSONAS 

SERVICIOS 

INGRESOS 

MENSUALES 
(Miles $) 

Hombres 

Mujeres 

Luz 

Agua 

1 

28 

4 

3 

si 

si 

6.000 

2 

33 

2 

6 

si 

si 

5.800 

3 

42 

3 

5 

si 

no 

7.200 

4 

06 

4 

4 

no 

no 

6.000 

5 

01 

4 

2 

si 

si 

4.800 

6 

19 

3 

4 

no 

si 

6.000 

7 

22 

2 

5 

no 

si 

5.700 

8 

38 

4 

2 

si 

si 

6.400 


Estrato III 


NUMERO 

DE ORDEN 

NUMERO 

ALEATORIO 

PERSONAS 

SERVICIOS 

INGRESOS 

MENSUALES 
(Miles $) 

Hombres 

Mujeres 

Luz 

Agua 

1 

15 

3 

7 

si 

si 

4.600 

2 

20 

5 

4 

no 

no 

5.200 

3 

16 

6 

3 

no 

no 

6.000 

4 

09 

5 

7 

no 

no 

7.000 

5 

12 

2 

8 

si 

si 

6.800 

6 

18 

6 

5 

si 

no 

5.900 

7 

25 

4 

8 

no 

si 

7.000 

8 

14 

5 

5 

no 

si 

6.200 
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Information complementaria 

N = 150 viviendas N 1 = 75 N 2 = 50 N 3 - 25 Z = 2 (P = 95%) 

E = 5% (promedio) E = 10% (proportion) 

Estrato I : Vivienda de menos de 5 personas 
Estrato II : Vivienda de 5 a 8 personas 
Estrato III : Viviendas de 9 y mas personas 

Se pide: suponga una n (encuesta piloto) de 24 viviendas para determinar el tamano de la muestra 
mediante la afijacion igual para: 

a) El ingreso por familiar b) Proporcion de vivienda con servicio de luz. 

99. Considere que el tamano de la muestra obtenida en el punto (a) es de 24 y con la informacion 
obtenida calcule: los limites de confianza del 95% para el estimativo total de los ingresos de las 
familias, aplicando la Afijacion igual. 

100. Con los datos del ejercicio 98 estime el total de viviendas con servicio de agua, trabajando con una 
confianza del 95%, aplicando Afijacion igual. 

101. Con los datos del ejercicio 98 considere a in = 24 viviendas como si fuera una sola muestra sin 
estratificar (M.A.S.) y estime mediante el calculo la razon de hombres y mujeres con una confianza 
del 95%. 

102. Se tiene el listado de consumo de came (gramos) de las familias residentes en un barrio de Bogota. 

Se quiere determinar el numero de familias que se deben entrevistar, cuyo objetivo es el de estimar 
la venta de came en dicho barrio. 

Calcular el tamano de la muestra con un error de 20 gramos y una seguridad del 90%. No se conoce 
la varianza poblacional. 


CONSUMO DIARIO DE CARNE 


No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

1 

789 

34 

782 

67 

712 

100 

748 

133 

746 

166 

744 

199 

859 

232 

742 

265 

847 

298 

779 

2 

807 

35 

713 

68 

792 

101 

863 

134 

761 

167 

721 

200 

763 

233 

721 

266 

792 

299 

746 

3 

802 

36 

787 

69 

782 

102 

740 

135 

729 

168 

790 

201 

707 

234 

744 

267 

785 

300 

741 

4 

765 

37 

736 

70 

793 

103 

734 

136 

775 

169 

758 

202 

728 

235 

735 

268 

862 

301 

765 

5 

735 

38 

751 

71 

792 

104 

780 

137 

812 

170 

711 

203 

811 

236 

111 

269 

781 

302 

796 

6 

895 

39 

765 

72 

754 

105 

755 

138 

816 

171 

792 

204 

921 

237 

854 

270 

774 

303 

910 

7 

799 

40 

815 

73 

692 

106 

851 

139 

767 

172 

761 

205 

744 

238 

788 

271 

749 

304 

850 

8 

749 

41 

762 

74 

815 

107 

763 

140 

745 

173 

825 

206 

808 

239 

706 

272 

748 

305 

736 

9 

742 

42 

737 

75 

832 

108 

749 

141 

757 

174 

734 

207 

752 

240 

707 

273 

795 

306 

778 

10 

892 

43 

733 

76 

810 

109 

902 

142 

730 

175 

827 

208 

760 

241 

722 

274 

804 

307 

772 

11 

864 

44 

738 

77 

714 

110 

747 

143 

799 

176 

803 

209 

733 

242 

749 

275 

782 

308 

798 

























768 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

No. 

Grms. 

12 

772 

45 

812 

78 

804 

Ill 

782 

144 

778 

177 

776 

210 

751 

243 

735 

276 

748 

309 

798 

13 

808 

46 

739 

79 

698 

112 

823 

145 

834 

178 

793 

211 

819 

244 

844 

277 

813 

310 

726 

14 

732 

47 

786 

80 

762 

113 

797 

146 

873 

179 

842 

212 

755 

245 

783 

278 

791 

311 

753 

15 

743 

48 

843 

81 

778 

114 

819 

147 

812 

180 

833 

213 

897 

246 

858 

279 

742 

312 

792 

16 

824 

49 

808 

82 

711 

115 

750 

148 

837 

181 

754 

214 

786 

247 

768 

280 

760 

313 

741 

17 

804 

50 

734 

83 

715 

116 

774 

149 

857 

182 

760 

215 

790 

248 

752 

281 

776 

314 

765 

18 

767 

51 

760 

84 

762 

117 

821 

150 

829 

183 

790 

216 

744 

249 

755 

282 

773 

315 

821 

19 

760 

52 

745 

85 

771 

118 

797 

151 

730 

184 

813 

217 

744 

250 

776 

283 

794 

316 

811 

20 

842 

53 

843 

86 

724 

119 

776 

152 

821 

185 

721 

218 

791 

251 

746 

284 

717 

317 

865 

21 

813 

54 

803 

87 

778 

120 

772 

153 

788 

186 

748 

219 

744 

252 

764 

285 

729 

318 

720 

22 

753 

55 

737 

88 

827 

121 

820 

154 

868 

187 

782 

220 

776 

253 

718 

286 

712 

319 

738 

23 

723 

56 

775 

89 

713 

122 

865 

155 

806 

188 

761 

221 

742 

254 

756 

287 

766 

320 

740 

24 

793 

57 

719 

90 

819 

123 

847 

156 

739 

189 

791 

222 

717 

255 

786 

288 

854 

321 

891 

25 

749 

58 

775 

91 

737 

124 

723 

157 

780 

190 

782 

223 

772 

256 

804 

289 

863 

322 

744 

26 

763 

59 

775 

92 

839 

125 

797 

158 

762 

191 

810 

224 

749 

257 

845 

290 

835 

323 

735 

27 

746 

60 

781 

93 

791 

126 

785 

159 

762 

192 

810 

225 

749 

258 

845 

291 

835 

324 

735 

28 

861 

61 

744 

94 

751 

127 

719 

160 

815 

193 

819 

226 

738 

259 

811 

292 

862 

325 

779 

29 

787 

62 

689 

95 

782 

128 

789 

161 

778 

194 

785 

227 

810 

260 

804 

293 

787 

326 

745 

30 

764 

63 

801 

96 

729 

129 

754 

162 

729 

195 

870 

228 

801 

261 

775 

294 

792 

327 

833 

31 

757 

64 

764 

97 

745 

130 

828 

163 

759 

196 

764 

229 

773 

262 

744 

295 

834 

Ex.= 254.860 

32 

714 

65 

796 

98 

744 

131 

726 

164 

798 

197 

772 

230 

732 

263 

850 

296 

763 



33 

852 

66 

766 

99 

786 

132 

751 

165 

854 

198 

764 

231 

867 

264 

757 

297 

839 

Ex. =199.627.173 


103. Con los datos del ejercicio 102, se desea hacer una estimacion del promedio de consumo de carne, 
con una confianza del 95% (utilizar el tamano muestral obtenido en el punto anterior). 

104. Con los datos del ejercicio 100 y el tamano obtenido, se desea hacer una estimacion del promedio 
de consumo de carne, con una confianza del 99%. 

105. Resuelva los puntos 103 y 104 considerando que el tamano de la muestra se ha duplicado (no es 
necesario tomar una nueva muestra solo debe duplicar la informacion obtenida), haga un analisis de 
los resultados obtenidos. 

106. Haga una estimacion para el total del consumo de came en libras (resultados del ejercicio 103). 

a. Diaria. 

b. Semanal, considere que el dia domingo se consume una libra mas por familia. 

107. Las familias consumen en hueso la tercera parte de su consumo en came. De acuerdo al ejercicio 
106b realice una estimacion para la venta total en arrobas, incluyendo el consumo de hueso. 

108. Con los datos del ejercicio 102, se pide probar la hipotesis, con un nivel de significacion del 5%, de 
que el consumo promedio es de 800 gramos (p = 800) frente a la altemativa de que: 

a. p = 800 gramos b. p < 800 gramos c. p > 800 gramos 

Si el consumo promedio verdadero es de 779 gramos, ^que tipo de error se comete en cada una de 
las altemativas del ejercicio 106? 
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109. Con los datos del ejercicio 102 determinar el numero de familias que deben ser entrevistadas ( Tl ) 
para hacer una estimacion del porcentaje de familias que consumen mas de 800 gramos; se desea 
cometer un error del 10% y se establece una confianza del 90%. 

a. Se considera que P = 0,50 

b. No se conoce el valor de P (recurrir a una encuesta preliminar). 

c. Obtener una estimacion y fijar los limites de confianza del 95% para la proporcion de la poblacion, 
que consume mas de 800 gramos. 

110. Con los resultados del ejercicio 109, considere a = 0,08 para probar la hipotesis de que P = 0,4, 
frente a la altemativa de que: 

a) P = 0, 4 b) P < 0,4 c) P > 0,4 

111. Con los resultados obtenidos en el ejercicio 110, determinar que tipo de error se comete, si se 
considera que la proporcion verdadera es de 0,45. 

112. Con los datos del ejercicio 102 se pide: 

Dividir la poblacion en tres estratos 
Estrato I : Menos de 780 gramos 
Estrato II : Desde 780 hasta 830 gramos 
Estrato III : Mas de 830 gramos. 

a) Determinar el tamano de la muestra, utilizando los metodos de Afijacion igual y proporcional, 
con una confianza del 95% y un error del 1% 

b) Fijar los limites del 95% para el promedio y el total de consumo de came (en libras) en la 
semana. 

113. Determinar el tamano de la muestra, por el metodo de Afijacion optima, utilizando los diferentes 
metodos establecidos. Para ello se da la siguiente informacion: 


Costo total 

$200,000 

Costo fijo 

$150,000 

Costo fijo unitario 

$ 

2.000 

Costo variable unitario 

$ 

1.200 (para el primer estrato) 

Costo variable unitario 

$ 

1.500 (para el segundo estrato) 

Costo variable unitario 

$ 

2.300 (para el tercer estrato) 

Confianza del 95% 



Error del 6% (20) = 1,20 


Z =1,96 

N, =120 


S 2 =0,69 

N 2 =180 


S x =0,83 

N 3 =300 


S 2 2 = 2,35 

N =600 


S, 2 =l,69 

W, =0,45 


S 2 =109,03 

W 2 =0,35 


II 

© 


W 3 = 0,20 
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114. Con la siguiente informacion poblacional: 

Estrato I 


No. DE ORDEN: 

1 

2 

3 

4 

5 

6 

7 

8 

X,: 

12,6 

13,0 

12,8 

12,5 

13,0 

12,9 

13,5 

14,0 


Estrato II 


No. DE ORDEN: 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 

x 2 

20,3 25,6 25,2 22,0 26,0 24,8 25,7 25,9 23,1 25,0 24,4 26,5 24,4 25,0 


Estrato III 



Se pide: 

a) Extraer una muestra de tamano nueve (Yl = 9) utilizando el metodo de muestreo Sistematico. 

b) Con el anterior resultado estime la media poblacional, fijando limites del 90%. 

c) Estime el total de la poblacion, con una confianza del 90%, aplicando el muestreo Estratificado 
proporcional. 

115. Se tiene la siguiente informacion: 


ESTRATOS 

N h 


*h 

C„ 

I Pequeno 

500 

3,48 

15,3 

$20 

II Mediano 

300 

2,80 

29,7 

30 

III Grande 

200 

4,00 

22,8 

40 


z = 1,96 E = 2,1 


Con los datos anteriores, se pide determinar el tamano de la muestra ( Yl ) aplicando el metodo de 
Afijacion optima, obteniendo los tamanos muestrales en cada estrato. 

116. Considerando la informacion del cuadro como si fuera de la muestra y los tamanos muestrales del 
punto anterior, fije los limites de confianza del 95% para la media de la poblacion. 

117. Con el punto anterior del tema Asignacion igual y optima del punto 104; considere los resultados 
del numeral b) y seleccione una muestra de tamano 8 mediante la Asignacion proporcional y 
estime el valor promedio y el total para X, fijando limites de confianza del 95%. 

118. Considerando los datos del punto 104, tema Asignacion igual y optima, determine el tamano de la 
muestra mediante el metodo de Asignacion proporcional. 

119. Considere que los datos del punto 104, tema Asignacion Igual y optima se obtuvo de una muestra 
de tamano 80. Determine el estimado para el promedio y total de la variable X, mediante el metodo 
de Asignacion optima, con una confianza del 95%. 
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120. Con los datos del ejercicio 105, tema Asignacion igual y optima, siendo C x = 1.000 C 2 = 1.500 y 
C 3 = $2,000, ademas, la diferencia entre el costo total y el costo fijo es de $3,000. Con los anteriores 
datos determinar el tamano de la muestra tanto para la variable X, como para el atributo A. 

121. Con los datos del ejercicio 105, tema Asignacion igual y optima, seleccionar una muestra preliminar 
de nueve (9) elementos, distribuidos proporcionalmente para cada estrato. Ademas, sabiendo que la 
confianza es del 95%, el error del 3%, costo total $400,000, costo fijo de $250,000 y costos unitarios 
de Cj = $3,000 C 2 = $4,000 y C 3 = $5,000, calcular los tamanos muestrales para cada estrato 
mediante la asignacion optima (aplicar dos de las formulas para calcular n , utilizando la variable K). 

122. Una firma industrial tiene 4.000 empleados, de los cuales el 72% son operarios de produccion; 21% 
personal administrative y servicios generates y un 7% directivos. Se quiere determinar una muestra 
(n) de esos tres grupos de personas, para estimar cuantas utilizan el restaurante de la empresa para 
almorzar, aplicando el metodo de afijacion proporcional. Algunos funcionarios antiguos aseguran 
que el restaurante es utilizado por un 48% de operarios; 21% del personal administrativo y el 4% 
del personal directivo. Utilizar el error del 5% y una confianza del 95,5% para calcular n. 

123. De acuerdo al tamano de la muestra obtenido en el punto anterior, se realizo la investigacion con 
los siguientes resultados: 72% de operarios; 55% personal administrativo y 15% personal directivo. 
Con dicha informacion estime la proporcion y el total de empleados de la firma industrial, que 
toman almuerzo en el restaurante de la empresa, fijando limites del 95% de confianza. 

124. Con el resultado anterior, se desea probar la hipotesis de que el 70% del total de empleados toma 
almuerzo en el restaurante, frente a la altemativa de que sea diferente. 

125. La casa principal de una cadena de almacenes esta interesada en saber el volumen de ventas, cuentas 
atrasadas y su valor. Para reducir los costos de muestreo, se utilizo la afijacion optima. 


ALMACEN /ESTRATOS 

I 

II 

III 

IV 

No. clientes: (poblacion) 

1.700 

2.300 

4.600 

3.400 

Volumen ventas: (millones) (muestra) 

800 

1.300 

2.200 

1.800 

No. cuentas atrasadas (muestra) 

8 

10 

18 

12 


Considere el tamano de la muestra, mediante la afijacion optima de 120 clientes y las varianzas de 
las ventas para los diferentes estratos son: 160 120 180 140 millones de pesos. Se pide estimar 
el total de las ventas y el total de cuentas atrasadas con un nivel de confianza del 95% 


126. En vista de la recesion economica, una empresa pretende reducir el numero de horas laborales 
por semana a cuatro. Otra altemativa consiste en cerrar una de sus cuatro plantas y despedir a los 
trabajadores. Para tener una idea de la opinion de los trabajadores, el jefe de personal desea realizar 
una muestra de empleados en las cuatro plantas para estimar la proporcion que prefieren la primera 
altemativa. 

La empresa emplea 90 personas en cada una de las plantas 1 y 2: 75 en la planta 3; y 35 en la planta 
4. Se estima que el 80% de los de la planta 4 estan a favor de la reduccion de la semana de trabajo, 
mientras que las otras plantas el 70% se inclinan por la segunda altemativa. a) Encuentre el tamano 
de la muestra, si se fija una confianza del 95%, un error del 10% y un costo unitario de $1,800. 
b) Cual es el tamano de la muestra para cada una de las plantas. c) Elimine el costo unitario 
($1,800) y calcule los tamanos muestrales para cada estrato en forma independiente y directa. 
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127. Se desea estimar el total de horas-hombre dejadas de trabajar y el total de trabajadores que fueron 
incapacitados debido a enfermedades o accidentes de trabajo en un mes determinado, en un sector de 
la economia. Para ello se estratifico en cuatro grupos, teniendo en cuenta el numero de trabajadores 
por establecimiento. 


ESTRATO 

No. TOTAL DE 

EMPLEADOS 

(poblacion) 

TOTAL HORAS-HOMBRE 

NO LABORADAS 
(Muestra) 

NO. EMPLEADOS 

INCAPACITADOS 

(Muestra) 

DESVIACION 

ESTANDAR 

Horas-hombre 

1 

3.400 

6.400 

100 

85 

2 

5.600 

8.000 

140 

130 

3 

12.700 

10.200 

180 

160 

4 

20.000 

18.300 

200 

220 


Mediante la Asignacion proporcional, se calculo el tamano muestral siendo de 2.620 empleados 
y se desea estimar: a) El total de horas-hombre no trabajadas y b) El total de personas que 
permanecieron incapacitados en el mes. En ambos casos fijar limites de confianza del 95% 

128. Se tiene la siguiente poblacion de 18 elementos 16 12 18 17 12 14 20 19 20 16 15 14 
13 18 16 22 25 y 16. 

a) Divida la poblacion en 2 estratos de tamano 11 y 7 respectivamente, indicando el criterio 
empleado. 

b) Seleccione al azar una muestra de tamano 8, aplicando el metodo de Asignacion proporcional, y 
fije los limites de confianza del 95% para la estimacion del promedio. 

129. Una empresa desea estimar el numero de horas-hombre dejadas de trabajar por diferentes motivos, 
ademas, el porcentaje de empleados que llegaron al trabajo con retardos superiores a los 25 minutos, 
en el mes en que se realizo la investigacion, en 6 fabricas localizadas en diferentes zonas del pais. 
Los empleados se estratificaron de acuerdo a los niveles de ocupacion. 


NIVEL 

OCUPACIONAL 

TOTAL 

EMPLEADOS 

MUESTRA 

VARIANZA 

horas-hombre 

Total 

Horas-hombre 

Numero de empleados 
con retardos superiores 
a 25 minutos 

Directives 

50 

120 

4 

210 

Ejecutivos 

120 

310 

10 

196 

Profesionales 

510 

2.100 

10 

250 

Tecnico-Adtivos. 

830 

4.300 

18 

360 

Operarios 

1.790 

8.800 

38 

430 


a) Se tiene establecido que el costo total de la investigacion es de $410,000, el costo fijo de $130,000 
y los costos unitarios de $700 para cada estrato. Determinar el valor de Tl y los Tl h . 

b) Con la informacion anterior, estime el total de horas-hombre y el total de empleados con retardos 
superiores a los 25 minutos. En ambos casos fijar limites de confianza del 95% 
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MUESTREO SISTEMATICO 


Mas que un metodo de muestreo, podria ser considerado como un proceso de seleccion, que algunos 
denominan seleccion a intervalos regulares. Generalmente se le define como la obtencion de los 
elementos o unidades de una muestra mediante la aplicacion de algun metodo sistematico, en el sentido 
opuesto a los aleatorios. Por tal motivo algunos no lo consideran como un metodo de muestreo al azar, a 
menos que la lista o marco se haya conformado al azar. 

El muestreo sistematico o en serie , se usa frecuentemente por ser un metodo simple, sencillo, direc- 
to y economico. Arroja buenos estimativos, cuando la variable esta ordenada, por anos, valor, cantidad 
de menor a mayor, etc. Se puede observar en las unidades seleccionadas, que la variable se distribuye en 
la muestra casi igual que en el Muestreo Aleatorio Estratificado , Asignacion proporcional. La muestra se 
selecciona, tomando las unidades a intervalos regulares. Veamos cual es el proceso de seleccion. 


a) Supongamos que la poblacion estudiada esta compuesta por 360 familias (en vez de las 355 
familias con las cuales se ha venido trabajando), ademas el tamano de la muestra (Muestreo 
Aleatorio Simple o el obtenido por el metodo de Afijacion) es de 30 familias; con esta informacion 
se podra determinar el intervalo de seleccion , simbolizada por I. 


1 = 


1 

/ 



N 

~n 


Reemplazando, se tiene: / 


360 

30 


= 12 (Cuando es un numero entero) 


Determinado el intervalo de seleccion, se debe obtener un numero aleatorio dentro de ese intervalo; 
supongamos que entre 001 y 012 se obtuvo el numero 004, el cual se denomina punto de arranque. Se ha 
hecho la primera seleccion dentro del intervalo, en razon a ser el intervalo (I) un numero entero. 


Una vez establecido el punto de arranque, mediante la seleccion aleatoria, se inicia el proceso de se¬ 
leccion sistematica, correspondiendo el numero 016 a la segunda unidad seleccionada; a esta se le suma 
nuevamente el valor del intervalo, para obtener la tercera unidad y asi sucesivamente. 


004 

016 

028 

040 

052 

064 

076 

088 

100 

112 

124 

136 

148 

160 

172 

184 

196 

208 

220 

232 

244 

256 

268 

280 

292 

304 

316 

328 

340 

352 











En el caso de que el valor obtenido para el intervalo de seleccion no sea un numero entero, se pro- 
cedera de manera diferente. Siendo la poblacion de 355 familias y el tamano 30, se tendra un intervalo 
igual a: 


/ = 


N 

n 


355 

30 


11,83 = 12 


Una vez calculado el valor del intervalo, debera redondearse al numero inmediatamente superior, 
por pequena que sea la fraccion. Mediante cualquier metodo de seleccion, determinamos un numero en¬ 
tre 001 y 355; supongamos que fue 208, a partir del cual (punto de arranque) se va acumulando el valor 
del intervalo asi: 
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208 

220 

232 

244 

256 

268 

280 

292 

304 

316 

328 

340 

352 

364 

Oil 

023 

035 

047 

059 

071 

083 

095 

107 

119 

131 

143 

155 

167 

179 

191 


El proceso mas utilizado es el de calcular el intervalo de seleccion sin importar si el numero es en- 
tero o si presenta decimales, en este ultimo caso, se aproxima al numero inmediatamente superior, luego 
se selecciona aleatoriamente (al azar) un numero dentro del intervalo, con el fin de obtener el punto de 
arranque, al cual se le va acumulando el valor del intervalo, es decir, se procede exactamente igual al 
primer procedimiento. 

Observemos los niveles de ingresos para cada uno de los numeros aleatorios obtenidos. 



Con la anterior informacion se puede efectuar la estimacion puntual, tanto para el promedio como 
para la proporcion, asi como tambien determinar el estimador por intervalo, con una confianza del 


95%. 


s 2 


123.868.200-30(1.833,33) 2 
30-1 


794.305,75 


x 


55.000 

30 


1.833,33 


X s = x ± t 


s 
f n 


fw 


(Nota: se trabajo en la calculate con el programa 
de estadistica, por lo tanto para s 2 , se tomaran todos 
los decimales en el calculo de la media) 


Xs= 1.833,33 ±2,045 

/ 


( 891,24 

\ 130 


ll——=1.833,33 ±318,39 
355 




2.151,72 = 2.151.716,06 
1.514,94=1.514.943,94 


En la proporcion se tendra: 



0,50 



Ps 

I 


= 0,5 ±2,045) 


0,5(0,5) 
30-1 


30 y 
355 


0,68 = 68 % 

0,32 = 32% 


Ahora veamos que hubiera sucedido si la poblacion se encuentra estratificada. Podriamos conside- 
rar dos procedimientos, en primer lugar, en el caso de que la poblacion estratificada, este enumerada en 
forma continua, desde 001 hasta N. 
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ESTRATO 

NUMERACION POR ESTRATO (A) 

NUMERACION CONTINUA (B) 

I 

Desde 001 hasta 162 

Desde 001 hasta 162 

II 

Desde 001 hasta 132 

Desde 163 hasta 294 

III 

Desde 001 hasta 61 

Desde 295 hasta 355 

Total 

355 


Los numeros aleatorios seleccionados en el ejercicio anterior, corresponden en la enumeracion 
continua, a los siguientes: 


No. 

ALEAT0RI0 
ANTERIOR (B) 

EQUIVALENCE 

(A) 

ESTRATO 


No. 

ALEATORIO 
ANTERIOR (B) 

EQUIVALENCE 

(A) 

ESTRATO 


No. 

ALEATORIO 
ANTERIOR (B) 

EQUIVALENCE 

(A) 

ESTRATO 

004 

004 

I 


124 

124 

I 


244 

082 

n 

016 

016 

I 


136 

136 

I 


256 

094 

n 

018 

018 

I 


148 

148 

I 


268 

106 

n 

040 

040 

I 


160 

160 

I 


280 

118 

n 

052 

052 

I 


172 

010 

n 


292 

130 

n 

064 

064 

I 


184 

022 

n 


304 

10 

m 

076 

076 

I 


196 

034 

n 


316 

22 

m 

088 

088 

I 


208 

046 

n 


328 

34 

m 

100 

100 

I 


222 

058 

n 


340 

46 

m 

112 

112 

I 


232 

070 

n 


352 

58 

m 


Si consideramos la informacion de la tabla dada para la Asignacion proporcional respecto al In- 
greso de las familias (x) en miles de ($) y Propiedad de la vivienda (a), y suponiendo que los tamanos 
muestrales por estrato sean: 


n x = 14 n 2 = 11 n 3 = 5 n = 30 


ESTRATO I 


No. DE 

ORDEN 

No. 

ALEATORIO 

X. 

i 

a. 

1 

004 

800 

no 

2 

016 

830 

si 

3 

028 

950 

si 

4 

040 

1.350 

si 

5 

052 

1.560 

no 

6 

064 

1.300 

no 

7 

076 

1.260 

no 

8 

088 

880 

no 

9 

100 

1.620 

no 

10 

112 

1.630 

no 

11 

124 

1.010 

no 

12 

136 

1.460 

si 

13 

148 

980 

si 

14 

160 

1.240 

no 


ESTRATO II 


No. DE 

ORDEN 

No. 

ALEATORIO 

X. 

a. 

1 

172 

2.060 

no 

2 

184 

1.870 

no 

3 

196 

2.020 

si 

4 

208 

2.320 

no 

5 

220 

2.060 

si 

6 

232 

2.360 

no 

7 

244 

1.860 

si 

8 

256 

1.990 

no 

9 

268 

2.080 

no 

10 

280 

1.660 

si 

11 

292 

1.650 

no 


ESTRATO III 


No. DE 

ORDEN 

No. 

ALEATORIO 

X. 

i 

a. 

1 

304 

2.860 

si 

2 

316 

3.320 

si 

3 

328 

3.620 

si 

4 

340 

2.930 

si 

5 

352 

2.860 

si 


N ] = 162 W { = 0,46 
N 2 = 132 W 2 = 0,37 
N 3 = 61 W 3 = 0,17 
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X, = 1.205 

x 2 = 1.993,64 

jc 3 =3.118 

P i = 

_ 6 __ 
14 " 

5 2 = 87.857,69 

s 2 = 52.025,45 

s*= 115.320 

Pi = 

0,36 

5, = 269,41 

s 2 = 228,04 

s 3 — 339,59 

Pi = 

1,0 


Lo primero que observamos es la forma de distribucion de los elementos en la muestra, igual a la 
obtenida mediante la Asignacion proporcional. El tratamiento que se da, para el calculo de los estimado- 
res puntual e intervalos de confianza, es exactamente igual al utilizado para este metodo. 

x, = ZW h x h x st = 0,46 (1.205) + 0,37 (1.993,64 + 0,17 (3.118) = 

1.822,01 = ($1,822,006,8) 

P, = ^W h p h Pst = 0,46(0,43) + 0,37(0,36) + 0,17(1) = 0,50 = 50% 






X= 1.822,01 ±2,052 


1 

^ 355 2 


87.857,69 


52.025,45 


115.320 


sts 

1 


162(162-14) 14 + 132(132-11)—jp— + 61(61-5) -j- 

1.922,91 = $1,922,910 


X. = 1.822,01 ±2,052^ 241,85 = 1.822,01 ± 100,91 




1.721,09 = $1,721,090 


P =0,50 ±2,052 


\ 355 2 


162(162-14) ° ,43 | ^ ,57 ' > + 132(132- 


-11)»M + 61(61.5)± 


- 0,66 = 66 % 

P t = 0,50 ± 2,052 J 0,005985 = 0,50 ± 0,16 Q 

^ 0,34 = 34 % 


Especificamente, en el muestreo aleatorio estratificado , la aplicacion del metodo sistematico , en 
primer lugar, se debe determinar el tamano de la muestra y luego los tamanos muestrales para cada uno 
de los estratos, por cualquiera de los metodos de Asignacion que hubiesemos decidido. En cada uno de 
los estratos muestrales, en forma independiente, se calcula el valor del intervalo de seleccion con el fin 
de aplicar la seleccion sistematica. 


Supongamos que mediante el metodo de Asignacion igual se obtuvo la siguiente informacion: 


n = 30 n x = 

Los intervalos son: 

Ni 162 

m ~ 10 — 


10 


17 


n 2 =10 n 3 = 10 




(Intervalos de seleccion en cada estrato) 
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Seleccionamos un mimero (aleatoriamente) entre 1 y 17, para el primer intervalo por ejemplo 9, 
se tendra que los mimeros de seleccion para este estrato seran 002 019 036 053 070 087 104 
121 138 155, ya que Nj es igual a 162. Para el segundo estrato , tambien se seleccionan mimeros 

aleatorios; supongamos que los resultados fueron 005 019 033 047 061 075 089 103 117 
131, en este ejemplo, el tamano proporcional N 2 es igual a 132; para el tercer estrato , los mimeros 
de seleccion fueron 01 08 15 22 29 36 43 50 57. Podemos observar que N 3 = 9, el cual se 

explica por la aproximacion efectuada en el valor del intervalo, al mimero inmediatamente superior, 
tal como generalmente lo hacemos. La experiencia, sin embargo, nos ensena que en algunos casos es 
preferible trabajar con un mimero inmediatamente inferior. Otro procedimiento a seguir para este caso, 
seria continuar la serie, es decir: al ir agregando de 7 en 7, supongamos que el ultimo es 57, al agre- 
garle 7, nos pasamos de 61, pues la suma seria 64, por lo tanto el mimero que sigue sera 03 y con ello 
se completa el total de elementos para la muestra en ese estrato, si no se hubiere completado, seguiria 
10 17 24 31, etc. 

En conclusion, en el muestreo sistematico , la primera unidad se selecciona mediante utilizacion 
de los mimeros aleatorios y el resto se selecciona automaticamente de acuerdo a un proceso prede- 
terminado. Cuando la lista esta ordenada por valor, tiempo, de menor a mayor, el procedimiento es 
equivalente al Muestreo aleatorio estratificado , Asignacion proporcional , en cuanto a las unidades 
seleccionadas. Es muy aplicado en estimaciones de deudores en un almacen que vende a credito; para 
revisar sumas, supongamos que de cada 10 cuentas se revisa minuciosamente una; en el control del 
horario de entrada y salida de los obreros en una fabrica, por ejemplo: se toman 12 tarjetas diarias y 
se las revisa; se puede utilizar tambien para la revision de obreros con el objeto de evitar el robo de 
elementos o herramientas, por cada 10 obreros que salen se revisa uno; otros muchos ejemplos se po- 
drian citar, tales como vehiculos que se revisan en un reten, barcos pesqueros que atracan en la costa, 
nombres en un directorio telefonico, etc. Es indispensable preocuparse en la aplicacion de este metodo 
por las periodicidades escondidas, por ejemplo, las ventas de un almacen, si solo se tiene en cuenta un 
dia a la semana (siendo el intervalo de 7) por ejemplo los jueves; esta muestra no seria representativa 
de todas las ventas diarias. Por otra parte en la aplicacion de este metodo se hace necesaria la enume- 
racion y ordenamiento de los elementos en la poblacion, lo cual en algunos casos es casi imposible. 

MUESTREO POR CONGLOMERADOS 

UNA ETAPA 

Si una poblacion se divide en grupo y se realiza una muestra, se dice que se ha realizado una muestra 
por conglomerados en una etapa , en la cual cada grupo sirve como unidad de muestreo. Recordemos 
que los estratos se definen como grupos mas o menos homogeneos en cuanto a su composicion interna; 
en cambio, en los conglomerados , se espera que la composicion interna sea lo mas heterogenea posible, 
de tal forma que cada conglomerado represente en lo posible a la poblacion. 

Es muy coimin que estos conglomerados hagan referencia a superficies o areas en que se ha divi- 
dido el terreno, por ejemplo, un barrio o una manzana que pueden considerarse como conglomerados; 
el primero como un grupo de manzanas, el segundo como un grupo de viviendas. Este metodo permite 
reemplazar a las unidades mas pequenas (unidades de seleccion) de las poblaciones cuando ellas no 
puedan ser enumeradas, por unidades mas grandes que las contienen, haciendolas faciles de listar y 
de manejar y desde luego resulta menos costoso que los metodos anteriormente presentados. Sin em¬ 
bargo, vale la pena senalar que entre mas pequeno sea el conglomerado, mas exacto sera el estimador. 
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Con frecuencia, a los conglomerados se les denomina unidades de muestreo primario. Para este 
metodo se presentan varias formas de trabajo para lograr que el estimador del parametro sea lo mas re¬ 
presentative, dependiendo de la caracteristica en la poblacion 


a) En primer lugar, vimos en el muestreo aleatorio simple como una unidad elemental de seleccion, 
familias, en un momento dado se constituia en conglomerado , al estar conformado por un grupo 
de personas; en ese caso, la proporcion se estimaba mediante la formula: 


Ha. 

i 

A 

V = 

!-/' 1 

Hd - 2pLam. + p 2 Hm 2 . 

Hm 

i 

[p] 

_ nifr 

n-' \ 


b) En segundo lugar, el muestro sistematico en algunos casos se parece en su aplicacion al muestreo 
por conglomerados, siendo equivalente la muestra Sistematica de un conglomerado, si se 
efectua una seleccion aleatoria de los (k) conglomerados en que se ha dividido la poblacion. 
Supongamos una seleccion sistematica de 30 familias de una poblacion estratificada, para la cual 
hemos calculado el intervalo de seleccion. 


Se podra decir, que aproximadamente se tienen 12 grupos o conglomerados de 30 unidades cada 
uno. Mostraremos algunos de esos conglomerados, para que el estudiante se forme una idea de su con- 
formacion. 


Conglomerado No. 01 


Conglomerado No. 02 


No. 

ORDEN 

No. 

ALEATORIO 

X. 

i 

a i 

1 

001 

920 

no 

2 

013 

1.260 

no 

3 

025 

1.350 

no 

4 

037 

1.260 

no 

5 

049 

1.010 

no 

6 

061 

1.130 

si 

7 

073 

890 

si 

8 

085 

1.010 

no 

9 

097 

1.140 

si 

10 

109 

1.020 

si 

28 

325 

3.210 

no 

29 

337 

3.280 

no 

30 

349 

2.960 

no 


No. 

ORDEN 

No. 

ALEATORIO 

x i 

a i 

1 

002 

1.060 

si 

2 

014 

1.040 

no 

3 

026 

1.250 

si 

4 

038 

950 

si 

5 

050 

1.000 

no 

6 

062 

840 

no 

7 

074 

1.060 

no 

8 

086 

1.630 

si 

9 

098 

960 

si 

10 

110 

850 

no 

28 

326 

3.240 

si 

29 

338 

3.860 

si 

30 

350 

3.290 

si 
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Conglomerado No. 03 


Conglomerado No. 04 


No. 

ORDEN 

No. 

ALEATORIO 

X. 

i 

a i 

1 

003 

1.080 

no 

2 

015 

1.450 

no 

3 

027 

1.050 

si 

4 

039 

980 

no 

5 

051 

1.120 

si 

6 

63 

1.350 

no 

7 

075 

860 

no 

8 

086 

1.030 

si 

9 

099 

930 

no 

10 

111 

1.450 

si 

28 

327 

3.860 

si 

29 

339 

2.610 

si 

30 

351 

2.860 

si 


No. 

ORDEN 

No. 

ALEATORIO 

X. 

a i 

1 

012 

790 

no 

2 

024 

840 

si 

3 

036 

790 

no 

4 

048 

890 

si 

5 

060 

980 

si 

6 

072 

1.060 

no 

7 

084 

880 

no 

8 

087 

1.130 

si 

9 

108 

960 

no 

10 

120 

- 

- 

27 

324 

2.840 

no 

28 

324 

2.960 

no 

29 

348 

2.790 

si 


Observemos al elaborar todos los conglomerados posibles, que en los 7 primeros cada uno tiene 30 
unidades y los restantes 5, tan solo tienen 29 unidades, ya que la poblacion es de 355 familias y no de 
360, para que tuviesen igual numero de elementos. 


Cada conglomerado sera una pequena replica de la poblacion. Una vez establecidos los grupos o 
conglomerados, utilizamos la Tabla de numeros aleatorios, con el fin de seleccionar un numero entre 01 
y 12. Supongamos que el resultado fue 03, correspondiente al conglomerado seleccionado, que se cons- 
tituye en una muestra de 30 elementos. 

c) En general, cuando una poblacion se divide en grupos o conglomerados y se quiere realizar 
estimativos, se debe usar la siguiente simbologia: 

N = Numero de conglomerados en la poblacion 

n = Numero de conglomerados en la muestra 

M. = Tamano de cada conglomerado (total de elementos en el grupo) 

M = 1M. = Total de elementos en la poblacion de N conglomerados 
m = Em. = Total de elementos en la muestra de Tl conglomerados 

M = (tamano medio de los conglomerados) 


y.. = Valor de la variable 

•'ij 

y. = Total del conglomerado en la muestra 

m j 


Zy :: y, n n mi 

y. = m — = (Media del conglomerado) y = 2y. = ^^y ; j (Total general de la muestra) 
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= y y 

y = Media general de la muestra Siendo y = = 

= = y 

y = Media de totales o total medio por conglomerado , en la muestra: y = — 


Es de anotar, que en el muestreo estratificado el estimador de una proporcion, por conglomerados 
se debe calcular con la siguiente formula: 


^ M iP h 




X/77 

h 


Siendo 


Ph = 


X a 

_ h j_ 

X/77 

hi 


y el error de estimacion sera igual a: 


77-1 

h J 

Veamos dos ejercicios que nos permitan entender el significado y la aplicacion con conglomerados 
iguales y desiguales, realizados en una etapa; y al mismo tiempo, observar el proceso que se sigue para 
el calculo del estimador, cuando se trata de una variable, ya que algunos de los ejemplos anteriores ha- 
cemos referencia al estimador de una proporcion, pero es una forma de trabajar con conglomerados en 
una etapa (ver: MAS y MAE). 

En primer lugar, para el muestreo por conglomerados iguales , suponemos que la poblacion de 355 
familias se ha dividido en 71 conglomerados y cada conglomerado se encuentra conformado por 5 fami- 
lias, asi que todos contienen el mismo numero de familias, por tal razon se les denomina conglomerados 
iguales. 

Consideremos ahora que la muestra esta constituida por 12 conglomerados: (Yl = 12), que han sido 
seleccionados aleatoriamente, como se observa en la siguiente informacion: 




i-fu 


n,m 2 , 


CONGLOMERADOS 

No. SELECCION 

No. PERSONAS POR FAMILIA 

TOTAL 

1 

18 

3-5-2- 1-4 

15 

2 

03 

3 -3 - 1 - 2 - 3 

12 

3 

64 

I 

* T) 

1 

cn 

1 

NO 

1 

'xl - 

19 

4 

36 

4-4-3-2-2 

15 

5 

41 

5-2-6-1-3 

17 

6 

38 

3-3-4-2-2 

14 

7 

30 

3-2-3-5-2 

15 

8 

22 

cn 

1 

1 

1 

<N 

1 

CN 

16 

9 

14 

1-3-6-1-2 

13 

10 

26 

2-1-5-2-1 

11 

11 

19 

3-2-3-3-1 

12 

12 

46 

CN 

1 

^1" 

1 

1 

1 

NO 

17 


N = 71 n —12 


Con los datos de la anterior muestra, calcularemos el promedio para cada conglomerado. 
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I 

X 

i 

X 

i 

x 2 

i 

1 

15 

3,0 

9,00 

2 

12 

2,4 

5,76 

3 

19 

3,8 

14,44 

4 

15 

3,0 

9,00 

5 

17 

3,4 

11,56 

6 

14 

2,8 

7,84 

7 

15 

3,0 

9,00 

8 

16 

3,2 

10,24 

9 

13 

2,6 

6,76 

10 

11 

2,2 

4,84 

11 

12 

2,4 

5,76 

12 

17 

3,4 

11,56 

Z 

176 

35,2 

105,76 



35,2 


= 2,93 = 3 


2 

S3 = 

N-n 

Hx-nx 2 

i 


Nn \ 

■ n - 1 . 


71—12 

' 105,76-12(2,93/ 

1.71(12) J 

12-1 J 


£=(0,0692) (0,2492) = 0,017 


El anterior resultado indica que en promedio (x ) hay 3 personas por familia. 

En el caso de muestreo por conglomerados desiguales con probabilidades iguales, supongamos 
que el barrio de 355 familias esta compuesto por 25 manzanas y cada una de ellas se constituye en un 
conglomerado desigual con respecto al numero de viviendas. 

De la poblacion N = 25 (conglomerados), se extrajo una muestra de 10 manzanas (n = 10), con la 
siguiente informacion: 


CONGLOMERADO 

VIVIENDA 

yi 

PERSONAS 

yr 

1 

5 

18 

324 

2 

12 

48 

2.304 

3 

8 

40 

1.600 

4 

10 

36 

1.296 

5 

14 

30 

900 

6 

11 

45 

2.025 

7 

13 

34 

1.156 

8 

9 

28 

784 

9 

8 

39 

1.521 

10 

15 

61 

3.721 

Z 

105 

379 

15.631 


Xm 2 = 1.189 

i 

I y 2 . = 15.631 
Ym = 105 

l 


= 379 


Yjn.y. = 4.182 

i 


En primer lugar identifiquemos los simbolos que se deben utilizar: 

N = Numero total de conglomerados en la poblacion (N = 25) 
n = Numero total de conglomerados en la muestra (n= 10) 

M = Numero total de elementos en la poblacion (M = 330 viviendas) 
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M. = Numero de elementos en cada conglomerado poblacional. 
M = EM. = 330 viviendas 

i 

M = Tamano medio de los conglomerados 
30 

M = EM. = ^ = 13,2 (Promedio de viviendas por conglomerado) 

n 

379 

y= — =3,79 


y = = Promedio de personas por conglomerado de la muestra 


10 


= 14 _ Ny 

7 Mn y ‘ M 


y = Estimador de la media por elemento: y = 


1 


■(379) = 2,87 


13,2(10) 

El anterior estimador tambien se puede calcular de la siguiente forma: 


= 25(37,9) 947,5 

y =--— = --— = 2,87 Promedio de personas por vivienda 


330 


330 


F :-i 


1-/1 

'Zyj- ny 2 ' 


1 - °’ 4 i r 

. nM 2 . 

n - 1 

v if 

10(3,2) 2 J 


15.631-10(37,9) 2 


/=^-=^= 0 ’ 4 
Tambien se puede calcular: 


v m 


' N-n ' 

^ Ev 2 — nv 2 

Nn(n- 1) 

_ M 2 y ' y 



10-1 


V r = (0,00034) (140,7667) = 0,048 


v m = 


25-10 


25(10X9) 


(13 2? 


. ( 15 . 631 - 10 ( 37 , 9) 2 


= 0,048 


De otra manera se podra hacer: 





Reemplazando se tendra que: 


L= J 

M 25 


1 


25 


i330l 1 10(9) 


15.631- 


(379 f 


10 


= 0,048 


Sj=j— j 0,048 — 0,22 (Error estandar de 0,22 personas) 

El error de estimation , tambien se puede calcular usando los estimadores de la razon, siendo: 


v = 

\y] 


'l -/ 

Ey 2 - 2yEM.y. + y 2 EM 2 . 

nM 1 

n - 1 
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1 - 10 1 

~~25” 

15.631—2(2,87X4,182)+2,87 2 (l. 189) 

10(13,2) 2 

10-1 


0,054; 


0,23 


MUESTREO BIETAPICO 


Se le denomina muestreo por etapas. Cuando son dos, recibe el nombre de bietapico y si son mas de 
dos etapas se le considera polietapico. Puede considerarse como un sub-muestreo y se trata de una 
modificacion del metodo de muestreo por conglomerados, ya que la primera muestra esta conformada 
por unidades que son consideradas como conglomerados, una vez seleccionados estos, se efectua una 
nueva seleccion o submuestreo dentro de cada conglomerado para la segunda etapa y asi sucesivamente. 

Los conglomerados que resultan de la primera division se les denomina unidades primarias , los 
de la segunda, secundarias y asi sucesivamente. Los conglomerados pueden ser de igual o de diferentes 
tamanos, siendo este ultimo caso el mas generalizado. 

De lo anterior se desprende, que lo caracteristico de este tipo de muestreo es el proceso de seleccion 
que se hace por etapas sucesivas; en cada una de la unidad es diferente, y las unidades finales (la ultima 
muestra) son las que nos permiten la realizacion de la encuesta, y la recoleccion de informacion; las an- 
teriores son consideradas unidades de seleccion. 

Son muchos los ejemplos que se podrian citar, en el caso del Muestreo por etapas. En primer lugar, 
para la realizacion de la encuesta de hogares, podriamos dividir la ciudad en barrios (clasificados por 
niveles de ingresos, que serian los estratos); en esta etapa se eligen en forma aleatoria o sistematica (de 
acuerdo al procedimiento adoptado), las unidades que conforman el tamano de la muestra, cuya unidad 
de seleccion es el barrio; la segunda etapa consistiria en elegir las manzanas en cada uno de los barrios 
seleccionados en la primera etapa. En la tercera etapa podrian seleccionarse las viviendas, de las manza¬ 
nas obtenidas en la etapa anterior. De continuarse con la etapa cuarta, tendria como unidad de seleccion 
la familia y podria ser considerado como el elemento, el individuo. 

Otro ejemplo, si una empresa tiene sistemas de venta a credito, para cada deudor se tendra una 
tarjeta, lo que implica tener varias gavetas, cada una de ellas con un numero de tarjetas. El proceso a 
seguir aplicando el metodo bietapico , consiste en enumerarlas y seleccionar una muestra cuya unidad sea 
gaveta, luego se vuelve a muestrear, enumerando las tarjetas en cada una de esas gavetas a fin de efectuar 
una nueva seleccion, teniendo como elemento final las tarjetas. 

De los anteriores ejemplos se desprende, que si la unidad de muestreo es un conglomerado consti- 
tuido por elementos o unidades de observacion, no es necesario considerar todas las unidades de observa- 
cion que pertenecen a la unidad seleccionada de muestreo. Esta misma unidad de muestreo, se constituye 
en una pequena poblacion de la cual se podra obtener una muestra y asi sucesivamente. Esto requiere la 
construccion de marcos, para cada una de las etapas. 

En el muestreo bietapico estratificado , se aplican formulas especiales que pueden ser consultadas 
en los diferentes textos de muestreo, lo mismo sucede en el Muestreo trietapico o polietapico y algo 
similar, cuando se trata de atributos. Para estos metodos se recomienda al lector consultar el libro del pro- 
fesor Francisco Azorin Poch (ver bibliografia) que presenta en forma bastante comprensible esta teoria. 
No se exponen estos metodos en este texto, por ser considerados extensos para los objetivos propuestos. 
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MUESTREO FOR CONGLOMERADOS DE DOS ETAPAS 


En varias oportunidades se ha definido el concepto conglomerado; pero vale la pena recordar que: el 
muestreo aleatorio por conglomerados es aquel en el cual cada unidad de seleccion es una coleccion, 
conjunto o conglomerado de unidades o elementos. Se dice que es de dos etapas o bietapico, ya que se 
obtiene primero una muestra aleatoria de conglomerados y, luego en una segunda etapa una muestra 
aleatoria de los elementos de cada conglomerado que han sido seleccionados. 

Este metodo facilita la elaboracion del marco en la primera etapa y luego el de la segunda, siendo 
al final mas economico que el obtenido mediante el Muestreo aleatorio estratificado. 


Estimacion de promedios y totales 

Supongamos que una firma tiene 110 fabricas distribuidas por todo el territorio nacional y se desea 
estimar el tiempo y numero de maquinas que duraron paralizadas, ya sea por mantenimiento o por dano, 
durante un trimestre. Por tiempo y distancia se disena una investigacion aplicando el Muestreo por 
conglomerados en dos etapas , para ello se procede a realizar una muestra de doce fabricas y en la 
segunda etapa, se selecciona una muestra del 20% de las maquinas de cada una de ellas. 

El problema se puede presentar de dos maneras: a) Conociendo el total de maquinas para las 110 
fabricas, por ejemplo 5.500 maquinas; b) Se desconoce el valor de M, es decir, el numero de maquinas. 

a) Cuando se conoce el valor de M 

Algunos simbolos de entrada que debemos conocer 

N = Numero de conglomerados en la poblacion N =110 
n = Numero de conglomerados en la muestra n =12 
M = Numero de elementos en la poblacion M = 5.500 

M = Tamano promedio del conglomerado M = = 

m = Numero de elementos en cada conglomerado. 

Veamos la presentacion de la informacion obtenida en la siguiente tabla: 

Informacion de una encuesta por muestreo aleatorio por conglomerados 


M = EM. 


5.500 

110 


= 55 
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8 

36 

7 

0 

0 

3 

7 

0 

1 

2 




1,86 

6,48 

9 

30 

6 

5 

0 

6 

0 

0 

4 





2,50 

7,90 

10 

64 

13 

0 

0 

0 

6 

5 

0 

10 

0 

6 

0 0 0 1 

2,15 

11,47 

11 

70 

14 

2 

0 

0 

0 

4 

6 

2 

0 

3 

6 2 0 0 0 

1,79 

4,95 

12 

50 

10 

2 

3 

5 

0 

0 

0 

0 

0 

1 

2 

1,30 

2,90 


Calculo del estimador de la media : 

tTLMjc. _ 1.216,09(110) 

Mn 5.500(12) 

M.x. = 46(2,44) + 38(3,13) + 52(2,50) +... = 1.216,09 
EM. = 46 + 38 + 53 + 60 + ... = 581 

Los limites de confianza del 95% para el estimador de la media es: 


X = x ± t 

c c 


r _ 

- - 


_ _ 

N-n 

1 

s 2 + 

b 

1 

L N J 

. nM 2 . 

nNM 2 ! 


EM. (M. 



S 


2 

b 


n -1 


X(M *.) 2 


2 Mx XMx + n (Mx ) 2 

c l l ' c' 


Reemplazando se tendra que: 


E(Mx) 2 = (46 x 2,44) 2 + (38x3,13) 2 + (52 x 2,5) 2 + ... = 132.247,64 

1 


p2 

' 


12-1 


132.247,64- 2(55)(2,03)(1.216,09) + 12[55(2,03)] 2 


= 934,1 


10,03 


14,13 


EM.(M. - m )— L = 46(46 - 9) — 2 -e 38(38 - 8) +... = 18.571,91 

' ' ' m. 9 6 


Ahora se tendra que: 


X =2,03 + 2,201 "1 


110-12 


110 J 


12(55) 2 ] 934 ’ 86+ [l2(110)(55) 2 J( 18 - 571 ’ 91 ) 


X =2,03 + 0,37 




2,40 


Horas 


1,66 


785 


Para el Total, los limites del 95% de confianza sabiendo que M = 5.500, se tendra: 
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110-12 


12(55) 2 


X = 5.500(2,03) ± 5.500(2,201)\ 110 

- 13.200 

X = 11.165 ±2.035 Total dehoras 

9.130 


934,86 + 


1 


. 12(110)(55) 2 _ 


(18.571,91) 


b) Cuando no se conoce el valor de M, las formulas anteriores sufren una ligera modificacion: 
IM.T. _ 1,216,09 


x = 


SM. 


— 2 — = 2 09 
581 Z,uy 


rt2 = 


.n —1JL 


E(Mx) 2 - 2x EM 2 .x. +x EM 2 

v l l y C l l C l 


EMx. = 46 2 (2,44) + 38 2 (3,13) + 52 2 (2,50) +... = 60.207,47 
EM 2 = 46 2 + 38 2 + 52 2 + 60 2 + 55 2 + ... = 29.781 

1 


,2 = 


U2-U 


132.247,64 - 2(2,09)(60.207,47) + 2,09 2 (29.781) 


= 969,71 


Los llmites de confianza del 95% para el estimador del promedio seran: 
X = 2,09 ±2,201 1 


_ 




110-12 

1 

969,71 + 

1 

[ no J 

[l2(49) 2 . 

. 12(110)(49) 2 _ 


ZM. 581 

M = - L = -2^- = 49 

n 12 


X = 2,09 ± 0,42 




2,51 

1,67 


Horas 


Y el total de horas, con un 95% de confianza, sera: 


X =5.390(2,09) ± 5.390(2,201)) 


_ 




110-12 

1 

969,71 + 

1 

[ 110 J 

[l2(49) 2 J 

[l2(110)(49) 2 _ 


(18.571,91) 


_ 


13.528,9 


X = 11.265,10 ± 2.263,8 = C Total de horas 

^ 9.0013 


Siendo M = NM = 110 (49) = 5.390 maquinas (estimacion) 


Nota: En la tabla, se puede dar unicamente el tiempo que permanece sin funcionar, para que el 
estudiante calcule cada uno de x. y S.; tambien pueden suministrarse solamente las dos ultimas 
columnas, evitando de esta manera el calculo de estas medidas. 
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Estimacion de una proporcion y total 

a) Se conoce el valor de M 

Cuando se conoce M, se va a estimar la proporcion de maquinas que se paralizan en el trimestre, 
ya sea por mantenimiento y/o reparacion. 


Informacion sobre una muestra por conglomerados doble etapa 


FABRICA 

M i 

m. 

i 

NUMERO 

PARALIZADOS 

P. 


1 

46 

9 

4 

0,44 

0,56 

2 

38 

8 

4 

0,50 

0,50 

3 

52 

10 

5 

0,50 

0,50 

4 

60 

12 

7 

0,58 

0,42 

5 

55 

11 

4 

0,36 

0,64 

6 

40 

8 

4 

0,50 

0,50 

7 

40 

8 

5 

0,63 

0,37 

8 

36 

7 

4 

0,57 

0,43 

9 

30 

6 

3 

0,50 

0,50 

10 

64 

13 

5 

0,38 

0,62 

11 

70 

14 

7 

0,50 

0,50 

12 

50 

10 

5 

0,50 

0,50 


Se cuenta el numero de maqui¬ 
nas que fueron reparadas o se les 
hizo mantenimiento. Informacion 
adicional. 


EM = 581 
#=110 
M= 5.500 



5.500 

110 


= 55 


EM 2 = 29.781 
1 


_ EM. 

M = — L = 


581 

12 " 


(cuando se estima) 


= 49 


P, 


N 

nM 2 M i p > 


Pc = 


110 

12(5.500) 


[284,44] = 0,4748 = 47,48% = 47% 


Los limites de confianza para el estimador se obtienen mediante la siguiente formula: 


: Pc ±l |; 


N-n 


N 


1I-L. 

JL nM 2 


^b + 


1 


nNM 2 





Siendo: s 2 = 


Reemplazando en la formula anterior se tiene que: 
1 


s r 


12-1 


7.172,31-2(0,47)(49)(284,88) + 12 [55(0,47)] 2 


= 188,12 


E(M.p.) 2 = [46(0,44)] 2 + [38(0,5)] 2 + [52(0,5)] 2 + ... = 7.172,31 
EM.p. =46(0,44) + 38(0,5) + 52(0,5) + ... = 284,88 

EM.(M-m.)]VL = 46(46 - 9)°’ 44xQ ’ 56 + 38(38 - 8) °’ 5xQ ’ 5 + ... = 580,24 
yyi. 9 8 
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Con una confianza del 95%, los limites seran: 
P = 0,47 ±2,201 


_ 




110-12 

1 

188,12 + 

1 

[ 110 J 

. 12(5 5) 2 . 

. 12(110)(55) 2 J 


(580,24) 


,0,62 = 62% 

p = 0 47 ±015 ' Horas Nota: El error obtenido es muy grande, 

9 ’ ’ X 0 32 = 32% es P os ^^ e 9 ue es ^° se deba trabajar 

^ ^ . , , 9 . i-i con una muestra muy pequena. 

Porcentaje de maqumas paralizadas. 

Para establecer los limites de confianza para el Total, sera: 


A = 0,47(5.500)±5.500(2,201) 
3.119 


110-12 


110 


1 


A = 2.285 ± 834 


+*1, 


12(55) 2 
Total de maquinas 


188,12 + 


1 


, 12(110)(55) 2 


(580,24) 


451 


b) Cuando no se conoce M 

Cuando se desconoce M se procede de la siguiente manera: 
1 


n — \ 

1 


^(M.p .) 2 - IpfiLM. p.) + pJLM. 
7.172,31-2(0,49)(14.435,24) + 0,49 2 (29.781) 


=16,02 


12-1 

^M]p. = 46 2 (0,44) + 0,38 2 (0,5) + 52 2 (0,5) + ... = 14.435,24 

'LM.p. 284 88 

581 °' 49 " 49% 

l 

Los limites de confianza del 95% para el estimador de la Proporcion, sera: 






[ 110-12 

1 

16,02 + 

1 

[ 110 J 

,12(49) 2 . 

.12(110X49 f. 


(580,24) 


P = 0,49 ± 0,20 




0,69 = 69% 


+* 0,29 = 29% 

Para el estimador del total, con una confianza del 95% seran: 
A = 0,49(5.390) ± 2,201(5.390) 


[110-12 

1 

16,02 + 

1 

[ no J 

,12(49) 2 . 

. 12(110)(49) 2 _ 


(58024) 


A =2.641 ± 1.068 


, 3.709 

Total de maquinas 


1.573 
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EJERCICIOS PARA RESOLVER 

La gran mayoria de los ejercicios de este libro, se encuentran resueltos en el Sistema de Information 
en Linea SIL. 

132. Una empresa de investigacion de mercados ideo un plan de muestreo para estimar las ventas 
semanales de un producto X en un area geografica. La empresa decidio muestrear ciudades dentro 
del area y luego supermercados dentro de las ciudades. La medicion de interes es el numero de 
articulos de dicho producto vendidos en una semana especifica: Ocho ciudades son muestreadas 
entre las 25 del area. Usando los datos de la tabla adjunta, estime el total de articulos vendidos en 
todos los supermercados del area, para la semana especifica, con una confianza del 95% 



CIUDAD 

No. SUPERM. 

No. SUPERM. 

MUESTREADOS 

No. DE ARTICULOS 

VENDIDOS POR SUPERMERCADOS 

1 

45 

9 

80 62 26 38 65 74 38 42 54 

2 

36 

7 

52 24 32 60 76 42 51 

3 

20 

4 

32 36 48 46 

4 

18 

4 

30 61 38 

5 

12 

3 

36 40 26 

6 

16 

4 

34 38 46 51 

7 

13 

4 

42 61 24 26 

8 

22 

5 

30 54 28 61 26 


133. Una cadena de supermercados se encuentra establecida en 70 ciudades. Un director de la compania 
quiere estimar la proporcion de establecimientos la cadena que no satisfacen un criterio de limpieza 
especifica, ellas se encuentran dentro de cada ciudad al parecer poseen caracteristicas similares, por 
lo tanto el Director decide seleccionar una muestra por conglomerados en dos etapas conteniendo 
la mitad de establecimientos en cada una de las ocho ciudades. El muestreo por conglomerado es 
conveniente en esta situacion debido al costo de traslado. Los datos recopilados se presentan a 
continuacion: 


CIUDAD 

NUMERO 

DE ESTABLECIMIENTOS 

EN LA CIUDAD 

NUMERO 

DE ESTABLECIMIENTOS 

MUESTREADAS 

NUMERO DE ESTABLECIMIENTOS 
QUE NO SATISFACEN 

EL CRITERIO DE LIMPIEZA 

1 

18 

9 

3 

2 

20 

10 

6 

3 

16 

8 

5 

4 

26 

13 

9 

5 

14 

7 

3 

6 

18 

9 

5 

7 

14 

7 

2 

8 

12 

6 

4 
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Estime el Total de establecimientos que no satisfacen el criterio de limpieza, fijando unos limites de 
confianza del 95%. 

134. El dueno de un vivero quiere estimar la altura de los arbolitos en un extenso terreno, el cual esta 
dividido en 50 lotes que varian levemente de tamano. El dueno cree que la altura es bastante 
homogenea en cada lote, pero pueden variar considerablemente de un lote a otro. Por lo tanto 
decide muestrear un 10% de los arboles dentro de cada uno de los 10 lotes, usando una muestra por 
conglomerado en dos etapas, los datos se dan en la tabla adjunta: 


LOTE 

NUMERO 

DE ARBOLITOS 

NUMERO DE ARBOLITOS 

ARBOLITOS MUESTREADOS 

ALTURA DE LOS ARBOLITOS 
(en pulgadas) 

1 

52 

5 

12 

12 

10 

13 



2 

56 

6 

10 

9 

7 

8 

10 

12 

3 

60 

6 

8 

6 

6 

10 

12 

8 

4 

46 

5 

7 

8 

7 

7 

6 


5 

49 

5 

12 

5 

8 

7 

7 


6 

51 

5 

6 

5 

7 

6 

6 


7 

50 

5 

8 

12 

10 

5 

5 


8 

61 

6 

5 

8 

10 

10 

6 

5 

9 

60 

6 

7 

6 

12 

6 

8 

6 

10 

45 

5 

10 

7 

7 

10 

9 



En el vivero hay aproximadamente 2.600 arbolitos. Estime la altura promedio de los arbolitos 
fijando limites de confianza del 95%. 

135. Suponga que un sociologo quiere estimar el numero total de personas jubiladas que viven en 
una ciudad. El sociologo decide muestrear manzanas y despues casas dentro de las manzanas. 
Seis manzanas son seleccionadas al azar de entre las 350 de la ciudad. Estime el numero total de 
residentes jubilados en la ciudad y establezca los limites de confianza del 95% 


MANZANAS 

NUMERO 

DE CASAS 

NUMERO DE CASAS 

MUESTREADAS 

NUMERO DE RESIDENTES 
JUBILADOS POR CASA 

1 

14 

4 

1 

3 

0 

0 

2 

14 

4 

2 

0 

1 

0 

3 

9 

4 

3 

0 

1 

1 

4 

12 

4 

0 

0 

1 

2 

5 

16 

4 

3 

2 

2 

0 

6 

13 

4 

1 

0 

3 

2 


136. Supongamos que en una ciudad se tienen registrados 620 establecimientos, correspondiente a la 
pequena industria y se desea investigar algunas caracteristicas de su fuerza laboral tales como: 
edad, nivel educativo y salarial, personas a cargo, tiempo de antiguedad, propiedad de la vivienda, 
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etc. Se selecciono una muestra de 10 establecimientos, investigando el 20% de sus trabajadores. 
Consideremos unicamente la antigiiedad y propiedad de la vivienda, con los siguientes resultados: 


ESTABLECIMIENTOS 

No.DE 

EMPLEADOS 

m. 

i 

ANTIGUEDAD 

PROPIETARIOS 

DE LA VIVIENDA 


s? 

1 

25 

5 

8,3 

12,35 

2 

2 

30 

6 

5,2 

4,28 

4 

3 

28 

8 

6,4 

6,54 

3 

4 

20 

4 

10,6 

11,20 

1 

5 

24 

5 

12,3 

8,36 

2 

6 

28 

6 

8,6 

4,16 

3 

7 

36 

7 

7,8 

6,12 

5 

8 

40 

8 

10,4 

5,26 

2 

9 

46 

9 

14,3 

8,35 

4 

10 

28 

6 

16,2 

7,28 

4 


Fijar limites de confianza del 95%, para la estimacion del promedio de antigiiedad, asi como el total 
de empleados propietarios de su vivienda. 


MUESTREO FOR FASES MULTIPLES 


Es facil confundirse, en cuanto a la terminologia se refiere, en este caso que es un Muestreo por etapas y 
por Fases multiples. En el primero como se vio, el proceso consiste en dividir la poblacion en grupos o 
conglomerados y tomar de ellos la muestra necesaria. Hecho esto, se subdivide dicha muestra en unidades 
de segundo grado, de la cual se selecciona una nueva muestra y asi sucesivamente. Dependiendo del 
numero de etapas, se habla de muestreo bietapico, trietapico o multietapico. 

El segundo caso , se presenta, cuando la informacion requerida, nos permite recogerla en momentos 
diferentes. Consiste en seleccionar una muestra grande en forma rapida, sencilla y poco costosa, acerca 
de las caracteristicas generates de la poblacion, objeto de estudio; generalmente este metodo nos permite 
analizar una variable de facil acceso que esta correlacionada con otra de dificil accesibilidad, de ahi que 
sea empleada con frecuencia en los metodos de estimaciones por regresion , para lo cual es necesario el 
conocimiento del total de la poblacion de la variable independiente (predictor), pero, por desconocerla, 
es preciso estimarla mediante una muestra. 

Una vez desarrollado el anterior proceso, se prosigue con la segunda fase, utilizando unidades ya 
consideradas como base para la realizacion de una nueva seleccion de una muestra mucho mas pequena, 
destinada al estudio de una caracteristica mas especifica. Supongamos que se emplea un cuestionario, 
elaborado en forma sencilla, aplicado a un grupo de 20.000 estudiantes universitarios, tornados como 
muestra. Recogida la informacion y de acuerdo a objetivos especificos, nos permitira elaborar otro for- 
mulario detallado para una muestra de 2.000 estudiantes, seleccionados de la anterior. Observemos que 
en este metodo de dos fases, llamado por tal motivo bifasico , la unidad es la misma. Si fuera de varias 
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fases o polifasico , la unidad seguira siendo la misma, en cambio en el Muestreo polietapico la unidad de 
muestreo cambia en cada etapa. 

El metodo polifasico permite obtener informacion, cuando se desea obtener o conocer la proporcion 
de elementos para cada estrato (en el muestreo estratificado) o cuando no se tiene informacion acerca del 
tamano de poblacion en cada estrato. 


METODOS MIXTOS 


Hemos explicado los metodos mas utilizados en el muestreo, vale la pena, hacer referencia a un sistema 
que en la practica es muy comun y que consiste en la combinacion de los diferentes metodos que se han 
venido exponiendo. No es raro que, en una investigacion por muestreo, la poblacion se divida en estratos, 
en uno de ellos se realice una muestra aleatoria, en otro una muestra sistematica, en otro la muestra sea 
por etapas, este ultimo requerira la conformacion de conglomerados. Todo este proceso de combinar dos 
o mas metodos de muestreo, recibe el nombre de Metodos mixtos. 
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GLOSARIO 



ABSCISA: Es una de las coordenadas enun piano 
cartesiano, correspondiente al eje horizontal (la 
otra se denomina ordenada). 

AFIJACION: Corresponde al numero de 
elementos asignados en una muestra, cuando 
ellos provienen de una poblacion estratificada. 

AFIJACION IGUAL: Cuando se asignan igual 
numero de elementos en cada una de las muestras 
estratificadas. 

AFIJACION PROPORCIONAL : Cuando los 
elementos se asignan en la muestra estratificada 
en la misma proporcion en que se distribuyen en 
la poblacion. 

AFIJACION OPTIMA: Los elementos se 
asignan en la muestra estratificada teniendo en 
cuenta el grado de variabilidad del elemento en 
cada estrato y en el costo que representa en la 
investigacion. (es conocido como Afijacion de 
Newman). 

AJUSTE: Proceso general para representar 
a uno de los componentes de una serie 
cronologica denominada tendencia. Se habla 
de ajuste rectilineo, parabolico, exponencial, 
logaritmico. 

ALEATORIO O AL AZAR: Cuando todos los 
elementos o unidades que constituyen o conforman 
la poblacion investigada, tienen la misma 
posibilidad de ser seleccionados. Generalmente la 
palabra “azar” implica que el proceso considerado 
es, en algun sentido probabilistico. 


AMPLITUD: Diferencia entre el mayor y menor 
de un conjunto de valores. Se considera que la 
amplitud del intervalo, es la diferencia entre el 
valor mayor y menor en cada uno de ellos, en una 
distribucion de frecuencias. Tambien se considera 
como una medida de dispersion, denominada 
“oscilacion”. 

ANALISIS DE REGRESION: Consiste en 
determinar la relacion o dependencia que pueda 
existir entre dos variables, se habla tambien de 
analisis de covarianza o variabilidad conjunta de 
dos variables. 

ANALISIS DE VARIANZA: Se utiliza la 
distribucion F para el analisis de varianza. 
Conocida en forma abreviada ANOVA, se basa en 
probar la hipotesis si las medias de varias muestras 
provienen de poblaciones que presentan la misma 
media. Se puede decir que, es la comparacion 
que se realiza suponiendo que tienen la misma 
varianza. 

ASIMETRIA: Se refiere a las distribuciones 
que no son simetricas con respecto a la ordenada 
central. Si una distribucion unimodal tiene una 
“cola” mas alargada hacia valores menores de 
la variable aleatoria, se dice que es asimetrica 
negativa (hacia la izquierda); en caso contrario, 
sera de asimetria positiva (a la derecha). 

ASOCIACION: Es el grado de dependencia o de 
independencia entre dos o mas variables ya sean 
tomadas en forma cualitativa o cuantitativa. 

ATRIBUTO: Caracteristica cualitativa, haciendo 
una distincion con el termino “variable”, pues en 
el primero los datos se expresan mediante palabras 
(sexo, ocupacion, profesion, etc.) o categorias 
y en el segundo se expresan en forma numerica 
indicando el valor que toma la caracteristica. 
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BASE: Punto de referencia, siendo el denominador 
al calcular un numero indice. Tambien en una serie 
de tiempo o cronologica se le toma como punto 
de partida en la contabilizacion de los periodos 
transcurridos en la serie. Hay indices con base fija 
y con base variable. 

BASE FIJA: Ver indice con base fija. 

BASE VARIABLE: Ver indice con base varia¬ 
ble. 

BATERIA DE PRUEBAS: Termino utilizado 
en psicologia, aplicada para designar un grupo 
de pruebas a las cuales son sometidos algunos 
sujetos. 

BATERIA PONDERADA: Corresponde a 
grupos de pruebas psicologicas o educacionales, 
cuyo peso o importancia denominada ponderacion, 
se le aplica al puntaje obtenido de los sujetos 
(personas). 

BIAS: Es un error sistematico que distorsiona 
el resultado estadistico, diferente al error 
aleatorio. A veces es originado por el empleo de 
ponderaciones incorrectas, tambien, se refiere a 
los errores que cometen los empadronadores. (ver 
errores ajenos al muestreo). 

BIMODAL: Distribuciones de frecuencias 
que presenta dos modas o valores modales (ver 
moda). 



C ADEN A DE MARKOFF: Expresion utilizada 
en dos sentidos diferentes (a) un proceso (Xt) es 
llamado como cadena, si el parametro tiempo 
es discontinuo: (b) toma esa denominacion si 


los valores de X son discontinuos. El primero 
mencionado parece preferible esta expresion. 

CADENA DE RELATIVOS: Ver enca- 
denamientos de indices con base variable. 

CARACTERISTICA: Es aquello que se 
estudia de un elemento, que puede ser cualitativa 
(expresada mediante palabras) denominada 
“Atributo” o cuantitativa (expresada en forma 
numerica) denominada ‘Variable”. 

CARTOGRAMA: Representacion grafica por 
medio de mapas, mediante el cual se presentan los 
datos conforme a distribuciones geograficas. 

CATEGORIA: Es la forma en que se pueden 
agrupar o clasificar las observaciones en un grupo 
de frecuencias. 

CENSO: Cuando se investiga a la totalidad de 
los elementos o unidades que constituyen una 
poblacion objetivo. Ver investigacion total. 

CHI - CUADRADO: Metodo de estimacion 
basado en la prueba de la bondad de un 
ajustamiento, mediante el cual se determinan 
valores de los parametros que hacen minimo el 
calculado, por medio de las frecuencias observadas 
(reales) y las frecuencias esperadas (teoricas) 
expresadas en termino de los parametros. 

CLASE: Utilizada en las distribuciones de 
frecuencias, el agrupar los datos en intervalos, por 
lo tanto cada uno de ellos tendra limites inferior y 
superior en cada clase, que algunos denominan como 
fronteras de clase. Se habla de intervalos de clase y 
de frecuencias de clase. (Ver intervalos de clase). 

CLASES EXTREMAS ABIERTAS: Cuando no 
estan definidos el primero y el ultimo intervalo 
de clase, lo cual representa inconveniente en 
la aplicacion de la mayoria de las medidas, 
permitiendo con frecuencia la utilizacion de la 
mediana y en algunos casos el Modo. 

CLASIFICACION: Algunos lo denominan como 
tablas o cuadros. De acuerdo a la forma como se 
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clasifican las observaciones. Se especifica de una 
sola entrada o simple; y de multiples entradas 
cuando son mas de dos caracteristicas las que se 
estan organizando. 

COEFICIENTE DE CONCENTRACION: 

Corresponde al coeficiente de GINI (1912) 
utilizada como medida de dispersion. 

COEFICIENTE DE CONFIANZA: Medida de 
la probabilidad asociada a un intervalo de confianza, 
dentro del cual debera estar el parametro con cierto 
grado de probabilidad. 

COEFICIENTE DE CORRELACION: Deno- 
minado tambien como coeficiente de correlacion 
de PEARSON, simbolizado por r o R y nos 
determina el grado de relacion o correlacion entre 
dos variables. Cuando el valor se acerca a 1 o -1, 
nos estara indicando una fuerte relacion positiva o 
negativa. Por el contrario, al acercarse a cero, nos 
indicara falta de relacion. 

COEFICIENTE DE CORRELACION MUL¬ 
TIPLE: Aplicada en la regresion multiple, 
simbolizado por R. Nos determina el grado de 
asociacion que puede existir entre mas de dos 
variables. 

COEFICIENTE DE PARCIAL: Es una for¬ 
ma de determinar la relacion en la variable 
dependiente, que se explica por cada una de 
las variables independientes, a la vez que se 
mantienen constante estas variables. 

COEFICIENTE DE CORRELACION 
DE LOS RANGOS: Fue propuesto por 
Spearman (1906) y corresponde su aplicacion a 
distribuciones no parametricas. Es una medida 
de correlacion o grado de asociacion entre dos 
conjuntos de rangos, siendo la unica manera de 
calcular la correspondencia entre ellos, basados 
en datos ordenados de dos variables. 

COEFICIENTE DE DETERMINACION: 

Termino equivalente a coeficiente de correlacion 
al cuadrado. El simbolo utilizado es R 2 . Se obtiene 
al dividir la varianza explicada de la variable Y 


por la varianza de la misma variable. Se considera 
como la parte de la variacion dependiente Y, 
explicada por la ecuacion de la regresion. 

COEFICIENTE DE REGRESION: Denomi- 
nado como pendiente de la linea, nos determina 
el angulo de inclinacion, ademas se podra decir 
que nos da el crecimiento o decrecimiento en la 
variable dependiente, por cada unidad que toma 
la variable independiente. 

COEFICIENTE DE VARIACION: Medida de 
dispersion relativa, resulta al dividir la desviacion 
tipica o estandar por la media aritmetica de esa 
misma distribucion, para comparar la variabilidad 
relativa entre dos o mas distribuciones que estan 
dadas en unidades de medicion diferentes; suele 
aparecer multiplicado por 100, expresandose 
en terminos porcentuales. Fue propuesto por K. 
Pearson (1895). 

COEFICIENTE ANGULAR: Ver coeficiente 
de regresion. 

COEFICIENTE DE POSICION: En la 

ecuacion de la recta Y=bx+c, en la cual b es el 
coeficiente angular (Pi) y c el coeficiente de 
posicion u origen en la ordenada (P 0 ), es decir, su 
valor se ubica en la ordenada, cuando utilizamos 
un piano cartesiano. 

COMIENZO AL AZAR: En la seleccion de 
una muestra sistematica, cuando los datos estan 
ordenados de menor a mayor (en cantidad, valor, 
tiempo), se hace a intervalos regulares, suele ser 
conveniente elegir el primer elemento o unidad 
de la muestra, como punto de arranque, mediante 
una seleccion al azar entre las primeras unidades 
que conforman el primer intervalo de seleccion de 
aquella poblacion. Ver: muestreo sistematico. 

COMPONENTES DE UNA SERIE DE 

TIEMPO: Son cuatro (4) los componentes: 
Tendencia, Variacion estacional, Variacion ciclica 
y Variacion aleatoria. Para algunos es la suma 
Y=T+ VE+VC+VA; para otros es el producto: 
Y=T x VE x VC x VAy para otros la combinacion: 
Y= T (VE+V C+VA). 
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CONCORDANCIA: Puede darse en la relation 
entre variables cuantitativas o cualitativas que 
tiene modalidades comparables, estableciendo la 
intensidad de dicha relacion. 

CONGLOMERADO: Grupo de elementos de 
gran variabilidad en su interior, pero de gran 
homogeneidad si son comparados entre si. 

CONSISTENTE: Es otro requisite para que se 
tenga un buen estimador, su valor sera cercano 
al parametro, cuando el tamano de la muestra es 
grande (tz>30). 

CONTINGENCIA: Es la diferencia entre las 
frecuencias reales u observadas y las teoricas 
o esperadas, consignadas en una tabla de 
contingencia. 

CONTROL DE CALIDAD: Metodo para 
controlar la calidad de un producto manufacturado 
que se produce en grandes cantidades. Su objetivo 
es detectar y eliminar alteraciones sistematicas de 
la calidad o reducirlas a un nivel aceptable. 

CORRECCION AL MUESTREO DE 
POBLACIONES FINITAS: Es aplicado en el 
calculo de los limites de confianza, cuando el 
tamano de la muestra es bastante pequeno, es 
decir, si la fraccion de muestreo ( n/N) es mayor 
o igual al 5%. 

CORRECCION DE YATES: Denominado 
tambien como correccion de continuidad, ajuste 
propuesto por Yates (1934) en el calculo de Chi- 
cuadrado en tablas de contingencias de “2x2”. 

CORRELACION: En el sentido mas general, 
significa la interdependencia entre datos 
cuantitativos o cualitativos, pudiendo ser 
extendido a mas de dos variables aleatorias. 
Frecuentemente nos referimos a la relacion entre 
variables aleatorias o entre rangos. 

CORRELACION CURVILINEA: Expresion 
para denotar a la correlacion en datos bivariantes 
(dos variables) cuando las regresiones no son 
lineales. Algunos no estan de acuerdo, pues la 


correlacion esta dada por un numero y no por una 
funcion que admite curvatura. 

CORRELACION DE LOS RANGOS: Mide la 
intensidad de la correlacion entre dos conjuntos 
de ordenamientos y el grado de correspondencia 
entre ellos. Los mas conocidos son los de Kendall 
(1938) y el de Spearman (1904). 

CORRELACION DIRECTA: Ver Coeficiente 
de correlacion. 

CORRELACION LINEAL: No es aconsejable 
esa expresion, utilizada muy frecuente en funcio- 
nes lineales de las observaciones. 

CO VARIACION: Variacion conjunta de dos o 
mas variables. 

COVARIANZA: Determina la variacion conjun¬ 
ta entre dos variables. Definido como la media 
aritmetica del producto de las desviaciones entre 
los valores que toman las variables y sus medias 
aritmeticas. Puede tomar signo positivo o negativo 
indicandonos una relacion positiva o negativa. 

CUADRO SIMPLE: Se refiere a una tabla o 
cuadro que presenta la variable y sus frecuencias. 
Una distribucion unidimensional (una variable) 
de frecuencias es un ejemplo. Es preferible evitar 
esta expresion en un sentido tecnico. 

CUARTILES: Se pueden calcular tres cuartiles: 
(0 cuartil uno; (Q ) cuartil dos, siendo igual 
a la mediana y el (^) cuartil tres. El total de la 
frecuencia (n) se divide en 4 partes. El primer 
cuartil nos indica un valor de la variable que 
supera al 25% de las observaciones y es superado 
por el 75% del mismo. 

CUESTIONARIO: Grupo o sucesion de 
preguntas disenado para obtener informacion 
sobre uno o varios puntos a los que habra de 
responder el informante. Ver formulario. 

CURTOSIS: Determina el grado de “apunta- 
miento” o “achatamiento” de una curva unimodal 
normal. Fue propuesto por K. Pearson en (1906). 
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En una distribucion normal el resultado deber ser 
igual a 3. En el caso de que sea menor que 3 sera 
achatada o platicurtica, si es normal o igual a 3 se 
denominara mesocurtica; si es mayor que 3 sera 
apuntada o leptocurtica. 

CURVA NORMAL: Es una curva de frecuencias 
simetrica, tiene una figura acampanada. Algunos la 
denominan como: curva de error, de probabilidad 
o campana de Gauss. Su funcion de probabilidad 
se encuentra determinada por un valor central (p) 
y la desviacion estandar (a). 

CURVA DE COMPERTZ: Denominadatambien 
como curva de crecimiento. 

CURVA DE LORENZ: Es un metodo grafico 
empleado para mostrar la concentracion de la 
propiedad de cantidades economicas, como por 
ejemplo ingreso. En la ordenada, se representan 
las cantidades de las variables y en la abscisa la 
frecuencia acumulada de la poblacion que posee 
esas cantidades. 



DATOS AGRUPADOS: Ver tablas de frecuen¬ 
cias o distribucion de frecuencias. 

DATOS CUALITATIVOS: Ver Atributo. 

DATOS CUANTITATIVOS: Denominados 
tambien como variables, se refiere a aquellas 
caracteristicas expresadas en forma numerica, 
tales como medidas (peso, altura, precios, etc.) o 
recuentos (numero de hijos, hogares, autos, etc.) 

DATOS ESTADISTICOS: Datos numericos 
referidos aun agregado de elementos individuals, 
que la estadistica compila, analiza e interpreta. 

DECILES: Uno de los nueve valores de una 
variable en que se divide la frecuencia total en 
diez partes iguales. 


DECISION: Ver Funcion de decision. 

DECISION ESTADISTICA. La prueba de una 
hipotesis estadistica implica la decision entre dos 
valores: aceptar o rechazar. En un plan de muestreo, 
en cada una de sus etapas habra de adoptarse una de 
las tres decisiones: aceptar, rechazar o continuar. 

DEFECTOS ADMISIBLES: En control de 
calidad, se refiere al numero de defectuosos 
admisibles en una muestra, como el numero critico 
tal que si es excedido, la totalidad restante del lote 
debera ser examinado o bien rechazar el lote. Ver 
Numero de aceptacion. 

DEPENDENCIA CAUSAL: Cuando dos varia¬ 
bles tienen como consecuencia una relacion de 
causa y efecto. 

DEPENDENCIA UNILATERAL: Es una regre- 
sion unilateral, donde se puede estimar la variable 
Y en funcion de X, pero no viceversa, tal como 
sucede en la regresion bilateral. 

DESCOMPOSICION DE UNA SERIE DE 

TIEMPO: Por medio de metodos estadisticos se 
suele separar una serie (cronologica) en sus partes: 
la tendencia, las variaciones ciclicas, estacionales 
y aleatorias. Cualquier serie en particular no 
necesariamente esta constituida por todos estos 
componentes. 

DESIGUALDAD DE TCHEBICHEFF - BIE- 

NAYME: Obtenida por Bienayme en la mitad 
del siglo XIX. Generalizada por Tchebicheff. Ver 
Teorema de Tchebicheff. 

DESPLAZAMIENTO CRONOLOGICO: 

Diferencia de tiempo por la cual una observacion 
precede (es anterior) a otra. 

DESVIACION: Son las diferencias que hay entre 
los valores que toma la variable y un punto fijo que 
puede ser la media u otro valor, denominado media 
teorica. 

DESVIACION ABSOLUTA: Valor absoluto, 
sin considerar el signo de la diferencia entre los 
valores de la variable y su media aritmetica. 
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DESVIACION CUARTIL: Ver Desviacion 
intercuartilica. 

DESVIACION ESTANDAR: Es una medida de 
dispersion, denominada tambien como desviacion 
tipica, siendo obtenida, mediante la raiz cuadrada 
de la varianza. 

DESVIACION ESTANDAR O TIPICA: Es la 

medida de dispersion mas extensamente empleada 
en una distribucion de frecuencias. Es igual a la 
raiz cuadrada positiva de la varianza.(a) 

DESVIACION ESTANDAR PORCENTUAL: 

Ver coeficiente de variacion. 

DESVIACION INTERCUARTILICA: Es otra 
medida de dispersion, tomando la diferencia que 
hay entre el cuartil tres (Q ) y el cuartil uno (Q ), 
siendo dividida entre dos. Se le conoce tambien 
como amplitud semi-cuartilica. 

DESVIACION MEDIA: Medida de dispersion, 
derivada de la desviacion promedio de las 
observaciones con respecto a la media, tornados 
en valor absoluto. Es la media aritmetica, de las 
diferencias entre los valores de la variable y su 
media aritmetica, tomadas en valor absoluto. 

DESVIACION MEDIANA: Es la media 
aritmetica de las diferencias entre los valores que 
toma la variable y su mediana, considerando las 
mismas en valor absoluto. 

DIAGRAMA DE BLOQUES. Ver: Histogramas 
de frecuencias. 

DIAGRAMA DE DISPERSION: Denominado 
nube de puntos; es una grafica donde se representan 
los datos de dos variables y cada par de datos se 
describen mediante puntos. 

DIAGRAMA DE ARBOL: Es una forma grafica, 
que nos permite elaborar un espacio muestral, 
donde aparecen los puntos muestrales de dos o 
mas etapas. 

DIAGRAMA PASTEL: Nombre que se le da a 
la grafica circular. 


DEVALUACION: Es la perdida de poder ad- 
quisitivo del peso o unidad monetaria de un pais 
con relacion a precios de mercado extemo, como 
por ejemplo frente al dolar o al euro. 

DESVALORIZACION: Es la perdida de poder 
adquisitivo, que sufre el peso con relacion a pre¬ 
cios intemos de mercado. 

DEFLACTAR: Consiste en transformar valores 
corrientes (a precios de mercado) a precios 
constantes, con respecto a un periodo determinado. 
Denominado tambien como INDEXAR. 

DIAGRAMAS DE FRECUENCIAS: Son 

graficas, generalmente utilizadas en la teoria 
estadistica, para representar la variable discreta. 

DIAGRAMA DE DISPERSION: Denominado 
tambien como “nube de puntos”, corresponde 
a una grafica de un conjunto de puntos que 
representa a dos variables relacionadas y cada 
punto representa a un par de observaciones. 
Tambien es el grado de desparramiento que 
muestran las observaciones, las cuales se miden 
como promedio de las desviaciones respecto a 
algun valor central (desviacion media, desviacion 
tipica) o por medio de una estadistica de orden 
(desviacion cuartilica o amplitud). 

DISTRIBUCION ASIMETRICA: 

Ver asimetria. 

DISTRIBUCION BIDIMENSION AL: Llamado 
tambien como distribucion bivariante, ya que 
muestra dos variables relacionadas. 

DISTRIBUCION BIMODAL: Distribucion de 
frecuencias con dos modos. 

DISTRIBUCION BINOMIAL: Tambien se le 
denomina distribucion Bernoulli por la 
participacion que tuvo en su desarrollo Santiago 
Bernoulli en 1713. Utilizado para describir los 
resultados de un experimento conocido tambien 
como proceso de Bernoulli, donde cada ensayo 
tiene dos resultados posibles. 
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DISTRIBUCION CONTINUA: Se dice que una 
variable es continua cuando puede tomar todos 
los valores en un cierto intervalo. 

DISTRIBUCION DE BERNOULLI: Sinonimo 
de distribucion binomial. 

DISTRIBUCION DE CHI-CUADRADO: 

Llamado tambien Ji-cuadrado, distribucion dada 
aparentemente por primera vez, por Helmet en 
1875 y redescubierto por Karl Pearson en 1900. 
Ver: Chi-Cuadrado. 

DISTRIBUCION DE FRECUENCIAS: 

Denominadas tambien como tablas o cuadros de 
frecuencias, es una forma de concentrar grandes 
cantidades en forma resumida donde se muestra 
el numero de veces (frecuencia) que se repite cada 
valor que toma la variable. 

DISTRIBUCION DE LAPLACE: Se la conoce 
bajo el nombre de Primera Ley de Laplace, 
distinguiendola de la Segunda Ley, que es la 
misma que da la distribucion normal. 

DISTRIBUCION F: Tiene varias aplicaciones, 
una de ellas es la realization de una prueba que nos 
permite comparar dos varianzas para determinar si 
son iguales; la otra, para determinar si tres o mas 
tratamientos, de informacion muestral, producen 
identicos resultados. 

DISTRIBUCION "t": Esta distribucion debida 
originalmente a “Student” (1980) aparece 
frecuentemente en la forma modificada por R.A. 
Fisher (1952), utilizado en pruebas de hipotesis 
y en intervalos de confianza para el estimado de 
la media poblacional, cuando no se conoce la 
desviacion tipica poblacional y ademas la muestra 
es pequena, siendo n < 30. 

DISTRIBUCION T: Nombre alternativo para la 
T de Hotelling. 

DISTRIBUCION DE MUESTREO: Por lo 

general, se refiere casi siempre a un esquema de 
muestreo que implique seleccion al azar. 


DISTRIBUCION DE POISSON: En una 

distribucion binomial, cuando del valor de 
presentation de un evento es tan pequeno que 
tiende a cero y ademas, el numero de sucesos es 
tan grande (generalmente mayor que 50) que se 
le considera como un suceso de poca ocurrencia, 
en estos casos, es aconsejable la distribucion 
de Poisson. Tambien en aquellos problemas 
que involucran espacio, ya sean areas o tiempo, 
siendo de gran aplicacion. 

DISTRIBUCION DE PROBABILIDAD: Es 

un listado o resultados que se obtienen de un 
experimento en condiciones normales, donde 
las probabilidades obtenidas estan asociadas con 
cada resultado. 

DISTRIBUCION DE STUDENT: 

Ver Distribucion de la t. 

DISTRIBUCION DE UNA VARIABLE: 

Denominada tambien como Distribucion 
Unidimensional, es decir, en ella se analiza una 
sola variable. 

DISTRIBUCION HIPERGEOMETRICA: 

Cuando se desarrolla un experimento, se obtiene 
como resultado las probabilidades para cada 
uno de los X exitos en n ensayos, siendo estos 
dependientes, para ello utilizamos la funcion 
hipergeometrica. 

DISTRIBUCION NORMAL: Se le suele 
denominar Gaussiana, Laplaciana, distribucion 
de Laplace-Gauss o de Gauss-Laplace o bien 
la segunda Ley de Laplace. Aparentemente fue 
descubierta por De Moivre como forma limite de 
la distribucion binomial. 

DISTRIBUCION BINOMIAL: Cuando de- 
sarrollamos un experimento se obtienen las 
probabilidades para cada uno de los X exitos en 
n ensayos independientes, para ello utilizamos la 
funcion de probabilidad binomial. 

DISTRIBUCION PLURIMODAL: Distribu¬ 
cion de frecuencias con mas de dos modas. 
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DISTRIBUCION SIMETRICA: Cuando los 
valores de las frecuencias absolutas y relativas 
que toma la variable son equidistantes a un valor 
central. En este caso, la Media, la Mediana y 
Moda son iguales. 



ECUACIONES NORMALES: Sistema de 
ecuaciones al que se llega en una estimacion por 
el metodo de los minimos cuadrados. 

EMPALME DE NUMEROS INDICES: En 

una serie de numeros indices, muchas veces hay 
necesidad de suspender una serie, por la poca 
representatividad que tiene, debido a la aparicion 
de nuevos items o desaparicion de los que se 
han venido utilizando, lo cual hace necesario 
una nueva, con una nueva base. Cuando se hace 
necesario continuar con el suspendido, se realiza 
un empalme, (lo mismo para el nuevo), a fin de 
obtener los indices con la nueva base, realizados 
mediante una regia de tres simple. 

ENCUESTA: Utilizado frecuentemente para 
denotar a las encuestas por muestreo. 

ENCUESTA DE OPINION: Encuesta por 
muestreo, por medio de la cual se intenta conocer 
las opiniones de los miembros de una poblacion 
humana dada. 

ENCUESTA EXPLORADORA: Ver Encuesta 
preliminar o piloto. 

ENCUESTA PILOTO: Encuesta generalmente 
de pequena escala, llevada con anterioridad a 
la encuesta principal. Su objetivo principal es 
aumentar la eficiencia de la investigacion, mediante 
el conocimiento de la reaccion de los informantes; 
problemas en el cuestionario; tiempo promedio 
por entrevista; familiarizacion del entrevistador, 
determinar el tamano mas efectivo de la unidad de 


muestreo. Se le conoce como encuesta exploradora; 
encuesta preliminar o pretest. 

ENCUESTA POR MUESTREO: Llevada a 
cabo mediante el empleo de metodos de muestreo, 
donde solo se toma una parte de la poblacion. 

ENSAYO: Es un intento deliberado de generar un 
suceso cuya ocurrencia se supone sometida a un 
esquema probabilistico. Puede ser definido como 
un experimento controlado, cuyo resultado es de 
naturaleza cierta. 

ENSAYOS A LO BERNOULLI: Sucesion de 
acontecimientos, ejemplo: lanzamientos de una 
moneda, siendo sucesos independientes, con 
probabilidad de “exito” constante. La distribucion 
de exitos esta dada por la distribucion binomial. 
Ver distribucion de Bernoulli y Distribucion 
Binomial. 

ENSAYOS INDEPENDIENTES: Cuando la 
probabilidad del resultado de cualquiera de ellos 
es independiente de los resultados de los demas, 
donde la probabilidad es la misma para todos los 
ensayos. 

ERROR: Tiene el mismo sentido que le damos 
en la vida diaria. En estadistica se emplea como la 
diferencia que puede haber entre el valor esperado 
y el verdadero. 

ERROR AJENO AL MUESTREO: Estos 
errores pueden surgir por distintos aspectos como: 
defectos en el marco; la fijacion de las unidades 
de muestreo, como en su seleccion; errores en el 
formulario; en la recoleccion, en la tabulacion, 
negligencia del personal en todo el proceso de la 
investigacion. Son errores sistematicos que no se 
pueden cuantificar. 

ERROR DE ESTIMACION: En general, es 
la deficiencia que puede haber entre el valor del 
estimador y el parametro (valor verdadero en la 
poblacion). 

ERROR DE INDAGACION: Ver Error ajeno al 
muestreo. 
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ERROR DE MUESTREO: Parte de la diferencia 
entre un valor poblacional (parametro) y una 
estimacion de la misma, obtenida a traves de una 
muestra aleatoria. 

ERROR DE OBSERVACION: Error que 
surge de imperfecciones en el metodo para 
observar, sean estas debidas a factores humanos 
o instrumentales. 

ERROR DE RESPUESTA: Ver Error ajeno al 
muestreo. 

ERROR DEL TIPOI: Se presenta en una prueba 
de hipotesis, cuando rechazamos Ho, siendo cierto 
o verdadero. 

ERROR DEL TIPO II: Cuando aceptamos una 
hipotesis que es falsa. 

ERROR ESTANDAR: Raiz cuadrada positiva 
de la varianza de la distribucion muestral, es decir, 
la desviacion muestral de un estimador puntual. 

ERROR ESTANDAR DE UNA ESTI¬ 
MACION: Hace referencia a la raiz de la varianza 
residual en una linea de regresion. 

ERRORES EN LAS ENCUESTAS: Surgen por 
efectos del muestreo y de otros no relacionados 
con el muestreo. 

ESPACIO MUESTRAL: Es un conjunto de 
elementos o sucesos posibles que se obtiene en 
una prueba. Tambien se puede definir como un 
conjunto de puntos muestrales posibles, como 
resultados de un experimento. 

ESPERANZA MATEMATICA: El valor 
esperado de una funcion de variables aleatorias, 
es su valor medio, no necesariamente lo mas 
frecuente. 

ESTADISTICA: Valor sumatorio calculado por 
medio de una muestra de observaciones, aunque 
no necesariamente, como estimados de algun 
parametro. 


ESTADISTICA CHI-CUADRADO: Ver: Chi- 
cuadrado y Distribucion Chi-cuadrado. 

ESTADISTICA DESCRIPTIVA: Metodos, pro- 
cedimientos, que permiten recolectar, organizar, 
clasificar, cuantificar, los cuales son presentados 
por medio de cuadros, graficas, la obtencion de 
valores que son resultados de aplicar algunas 
medidas que permiten describir el comportamiento 
de un hecho o conjunto de observaciones. 

ESTEREOGRAMAS: Diagramas que intentan 
representar una figura tridimensional sobre una 
superficie plana. Diagrama que representa las 
frecuencias de una distribucion de dos variables. 

ESTIMACION: Es el valor obtenido al calcular 
un estimado. 

ESTIMACION DE MARKOFF: Estimacion de 
un parametro derivado de un estimador obtenido 
mediante el teorema de Markoff. 

ESTIMACION POR EL METODO DE RE¬ 
GRESION: Es la estimacion del valor de variable 
Y (dependiente) en funcion de otra variable (X), 
supuestamente conocida (independiente). 

ESTIMACION POR INTERVALO: Son li- 

mites de confianza (inferior o superior) dentro del 
cual supuestamente debe estar el parametro (valor 
verdadero) con cierto grado de confianza. 

ESTIMACION PUNTUAL: Es un punto o valor 
de la variable, considerado como el que representa 
mejor al parametro. Es un valor numerico, 
utilizado como estimador del valor estadistico de 
la poblacion. 

ESTIMADOR: Es una medida aplicada a las 
caracteristicas de los elementos o unidades en una 
muestra. Algunos la denominan como medida 
estadistica o estadistico de la muestra. 

ESTIMADOR CONSISTENTE: Al aumentar 
el tamano de la muestra, converge en probabilidad 
al parametro que estima. 



GLOSARIO 


803 


ESTIMADOR EFICIENTE: Se refiere a aquel 
estimador que tiene la menor varianza entre todos 
los estimadores posibles. 

ESTIMADOR INSESGADO: Es aquella 
muestra que no tiene error, es decir, que el valor 
del parametro es exactamente igual al valor del 
estimador. 

ESTRATIFICACION: Consiste en dividir la 
poblacion en subpoblaciones, grupos o estratos de 
tal manera que cada grupo sea lo mas homogeneo 
posible, pero heterogeneo si comparamos los 
estratos entre si. 

ESTRATO: Ver Estratificacion. 

EXPERIMENTO: Es un conjunto de pruebas 
que originan resultados bien definidos. 

EXPERIMENTO BINOMIAL: Requiere (a) 
Que se tenga un numero n de ensayos repetidos; 
(b) solamente se tienen dos resultados (exito o 
fracaso); (c) los resultados son independientes; 
(d) la probabilidad de exito (p) es fijo. 

EXPERIMENTOS DE QUETELET: Consiste 
en la realizacion de pruebas, cada vez mas 
grande, observando que a medida que aumenta 
o disminuye la probabilidad, que al principio 
fluctua, se va estabilizando de tal manera que se 
le considera como la probabilidad de exito de un 
suceso en un solo ensayo. 



FACTOR DE CORRECCION PARA 
POBLACIONES FINITAS: Se aplica cuando 
la fraccion de muestreo es mayor del 5%, siendo 
igual a raiz cuadrada de N-n IN- 1. 

FACTOR DE EXPANSION: Numero de veces 
que se expande el tamano de la muestra para ser 
igual al tamano poblacional. 


FRACCION DE MUESTREO: Corresponde al 
porcentaje de la poblacion, que fue tornado como 
muestra. 

FRECUENCIA ABSOLUTA: El numero de 
veces que se repite cada valor que toma la variable. 

FRECUENCIA ABSOLUTA ACUMULADA: 

En una tabla de frecuencias como su nombre lo 
indica, son acumuladas las frecuencias absolutas. 

FRECUENCIA RELATIVA: Corresponde a 
cada una de las frecuencias absolutas que toma la 
variable, dividida por el total de observaciones ya 
sea en la poblacion o en la muestra. 


GRADOS DE LIBERTAD: Corresponde al 
numero de valores que pueden ser asignados 
libremente. Es utilizado en la distribucion “t” de 
Student cuando la muestra es n < 30 y ademas no 
se conoce la varianza poblacional y utilizamos la 
obtenida en la muestra. 

GRAFICO CIRCULAR: Denominado como 
pastel “torta”, es una representacion de datos 
cualitativos por medio de sectores dentro de un 
circulo, siendo cada sector el valor proporcional a 
los componentes del total. 

GRAFICO DE BARRAS: Es una grafica de 
frecuencias representadas por medio de barras o 
rectangulos, trazados con alturas proporcionales. 
Puede ser de barras simples o compuestas, en 
forma vertical u horizontal. 

GRAFICO DE CONTROL: Recurso grafico 
empleado para mostrar resultados obtenidos de 
muestras repetidas, provenientes de un proceso 
de produccion. 
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GRAFICO LOGARITMICO: Grafico en el cual 
ambos ejes (ordenada y abscisa) estan tornados 
en valores logaritmicos, correspondientes a las 
variables X y Y. 

GRAFICO LINEAL: Cuando un grafico 
representa las variables por medio de lineas 
poligonales. 

GRAFICO SEMI-LOG ARITMICO : Forma de 
representacion grafica en la que uno de los ejes 
esta dado en escala logaritmica y el otro en forma 
aritmetica. 



HIPOTESIS ALTERNATIVA: Correspondiente 
a la prueba de hipotesis, siendo la alternativa del 
parametro sometida a prueba, la cual se considera 
verdadera cuando rechazamos la hipotesis nula. 

HIPOTESIS ESTADISTICA: Es un supuesto 
que se hace acerca de un valor estadistico de la 
poblacion, denominado parametro. 

HIPOTESIS NULA: Es aquella hipotesis que 
se quiere probar, la cual consideramos como 
verdadera, distinguiendola de la hipotesis 
alternativa. 

HISTOGRAM A: Diagrama de frecuencias de una 
variable (unidimensional) continua, representado 
por rectangulos de areas proporcionales a las 
frecuencias de clase con el eje vertical, sobre los 
intervalos representados en el eje horizontal. 

HOMOGENEIDAD: Cuando el grado de 
variabilidad tiende a cero. 



INDEPENDENCES: Dos sucesos son inde- 
pendientes, si la probabilidad de presentacion de 
uno de ellos es la misma, este o no dado el otro. 

INDICE: Es una cifra relativa expresada en 
terminos porcentuales, que se emplea para indicar 
la variaciones en los precios, cantidades o valores 
para un periodo, con respecto a un periodo base. 

INDICE AGREGATIYO SIMPLE: Es el 

cuociente de dividir la suma de precios o 
cantidades de un periodo, por la suma de los 
precios o cantidades de un periodo base y luego 
multiplicado por 100. 

INDICE COMPARATIVO DE MORTALIDAD: 

Es una tasa de mortalidad promedio. Se puede 
considerar como un numero indice de la forma 
Marshall - Edgeworth (en el libro aparece de 
Marshall). 

INDICE DE CANTIDADES: Indica variaciones 
en las cantidades de un periodo con respecto a un 
periodo base. 

INDICE DOW JONES: Es un indice que indica 
las variaciones del precio de las acciones de un 
grupo industrial que se negocia en la Bolsa de 
Nueva York. 

INDICE DE LASPEYRES: Se tienen indices de 
precios y de cantidad. En el primero nos determina 
las variaciones en los precios, manteniendo como 
ponderaciones las cantidades del periodo base. En 
el segundo indica las variaciones en las cantidades 
manteniendo como ponderaciones los precios del 
periodo base. 

INDICE DE DROBISCH - SIDEWICK: Este 
indice es el promedio entre los indices de precios 
de Laspeyres y el de Paasche. Tambien puede 
calcularse el promedio de los indices de cantidad, 
tomando al de Laspeyres y el de Paasche. 
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INDICE DE KEYNES: Se tienen indices de 
precios y de cantidad. El primero trata de indicar 
las variaciones en los precios, comparando los 
periodos, tomando como ponderaciones las 
cantidades mas pequenas observadas; en cambio el 
segundo, indica las variaciones en las cantidades, 
ponderadas por los precios mas pequenos. 

INDICE DE FISHER: En realidad es una 
media geometrica. Se obtiene al calcular la 
raiz cuadrada, del producto entre el indice de 
Laspeyres y Paasche. Fue establecido por Irving 
Fisher en 1927, al principio se consideraba como 
la formula ideal, ya que era la unica que cumplia 
con ciertos criterios que el habia establecido. 

INDICE DE MARSHAL: Se calculan indices 
de precios y de cantidad, en los cuales las 
ponderaciones, corresponden a la suma de 
los precios (tanto del periodo base, como del 
investigado) en el indice de cantidad; y la suma de 
las cantidades como ponderaciones, en el indice 
de precios. 

INDICE DE PAASCHE: Indica las variaciones 
en los precios, estando ponderados por las 
cantidades del periodo investigado. Tambien, 
indica las variaciones en las cantidades, cuando 
estan ponderados por los precios del periodo 
investigado. 

INDICE DE PARETO: Se le denomina asi al 
coeficiente que aparece en la expresion de una 
curva de Pareto. Proporciona la evidencia de la 
concentracion de las rentas (ingresos ) o con mas 
generalidad en la concentracion de valores de la 
variable, en distribuciones de la forma de Pareto. 

INDICE DE PRECIOS AL CONSUMIDOR: 

IPC, es un indice mensual que trata de indicar 
las variaciones en los precios de los articulos 
de primera necesidad (bienes y servicios) de un 
periodo con respecto a un periodo base. 

INDICE DE PRECIOS AL PRODUCTOR: 

IPP, es un indice mensual, empleado para indicar 
las variaciones en los precios de los articulos que 
directamente vende el productor. 


INDICE DE VALORES: Se obtiene al dividir 
la sumatoria de valores (precio por cantidad) 
correspondiente al periodo investigado, por la 
sumatoria (agregado) de valores correspondiente 
al periodo base, multiplicando el resultado por 
cien. Generalmente se le considera como un 
relativo de valores. 

INFERENCIA ESTADISTICA: Consiste en 
realizar investigaciones pequenas, denominadas 
muestras, con las cuales se obtienen valores 
considerados como estimados de los valores en 
una poblacion. 

INSESGO: Es una de las propiedades que debe 
reunir un buen estimador, cuando este es igual al 
valor del parametro que es estimado. 

INTERVALOS DE CONFIANZA: Cuando se 
establecen los limites de confianza, es decir, los 
valores superior e inferior dentro del cual debera 
estar el parametro con cierto grado de confianza, 
de esta manera se establece el intervalo. Significa 
que no hay error. 

INTERVALO DE MUESTREO: Corresponde 
al muestreo sistematico. 

INTERVALO DE PREDICCION: Intervalo 
comprendido entre los limites superior e inferior, 
asociados a un valor estimado o pronosticado. 



LEPTOCURTICA: Corresponde a las medidas 
de apuntamiento o curtosis. Se le denomina asi a 
aquella curva mas apuntada que la normal. 

LIMITES DE CONFIANZA: Los valores de Ls 
y Li (limites superior e inferior) de los intervalos 
de confianza. 

LIMITES DE PROB ABILID AD: Limites 
superior e inferior asignados a un valor estimado, 
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con el objeto de indicar el intervalo dentro del 
cual se supone comprendido el valor poblacional, 
con cierta probabilidad de que asi suceda. 

LINE A DE REGRESION: Expresion sinonima 
de curva de regresion, usada generalmente, para 
denotar a la regresion lineal. 

LOTE: Termino utilizado en control de calidad 
en el sentido agregado o coleccion. Es un 
conjunto de unidades de un articulo producido 
bajo condiciones similares. 

LOTE DE INSPECTION: Lote que se va a 

inspeccionar, el cual se puede realizar sobre cada 
elemento o sobre una muestra de ellos. 



MARC AS DE CLASE: Termino utilizado para 
denotar el punto medio del intervalo de clase, es 
decir, la mitad entre el limite inferior y el superior 
de clase. 

MARCO: Lista o mapa en el cual se identifica 
con claridad el elemento que pertenece a una 
poblacion que se va a investigar. Existe un manejo 
a cada etapa de muestreo, en un plan de muestreo 
por etapas. 

MARGEN DE ERROR: Es aquel valor que se 
le suma y resta al valor del estimador (estimador 
puntual), con lo cual fijamos los limites o 
intervalos de confianza. 

MEDIA: Es el termino utilizado para identificar 
al promedio aritmetico, geometrico, cuadratico, 
cubico, etc. 

MEDIA ARITMETICA: Es el resultado 
de dividir a la suma de todos los valores 
observados por el numero total de observaciones. 
Frecuentemente se omite la calificacion 


“aritmetica”, de modo que cuando se menciona la 
palabra “media” se sobreentiende con ella “media 
aritmetica”. 

MEDIA ARMONICA: La media armonica de 
un conjunto de observaciones, es la reciproca 
de la media aritmetica del reciproco de las 
observaciones. Su resultado es menor que la 
geometrica y la aritmetica. 

MEDIA CUADRATICA: Corresponde a la raiz 
cuadrada de la media aritmetica de los cuadrados 
de los valores de la variable. Su resultado es 
mayor que el de la media aritmetica. 

MEDIA CUBIC A: Es la raiz cubica de la media 
aritmetica del cubo de los valores que toma la 
variable, su resultado debera ser mayor que el 
obtenido con la media cuadratica. 

MEDIA GEOMETRICA: Es la raiz enesima del 
producto de los valores de la variable. Cuando 
esta existe, debera estar comprendida entre la 
media armonica y la media aritmetica. 

MEDIA MOVIL: Denominada tambien como 
promedio movil, utilizado en las series de tiempo, 
generalmente para suavizarla. Se pueden tomar 
valores pares o impares para promediarlos. 

MEDIA PONDERADA: Es la media aritmetica 
para un conjunto de datos agrupados en una 
tabla de frecuencias, donde a cada valor de la 
variable se le asigna una frecuencia, que viene a 
convertirse en un factor de ponderacion. 

MEDIA TEORICA: Denominada como media 
presunta, cuyo origen es arbitrario denominado 
como origen de trabajo, utilizada en el calculo 
de las desviaciones. No es recomendable esta 
expresion. 

MEDIA VERDADERA: Expresion alternativa, 
pocoempleada,delparametroomediapoblacional, 
en contraste con la media de la muestra. 

MEDIAN A: Es el valor de la variable que divide 
a la frecuencia total en dos partes iguales. Es el 
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valor central de la variable, que supera la mitad de 
las observaciones y es superado por la otra mitad. 

MEDIDA CUARTILICA DE ASIMETRIA: Es 

una medida cuartilica de asimetria. 

(Q - M e ) - (M e - Q ) 

As = —-- 5 - 

Q3-Q1 

MEDIDA DE ASIMETRIA DE PEARSON: 

Propuesta por Pearson. Esta medida se obtiene 
dividiendo la diferencia entre la media y el modo, 
por el valor de la desviacion estandar. 

MEDIDA DE POSICION: Medida (promedio) 
que intenta, por medio de un valor central o tipico, 
representar a un conjunto de observaciones, 
correspondiente a una distribucion. 

MESOCURTICA: En las medidas de apun- 
tamiento, es la forma de denominar a la curva, 
cuando ella toma la forma correspondiente a la 
distribucion normal. 

METODO CLASICO DE PROBABILIDAD: 

Consiste en considerar a la probabilidad como el 
cuociente de dividir al numero de exitos por el 
total de casos posibles. 

METODO EMPIRICO DE PROBABILIDAD: 

Cuando se sabe la probabilidad de un suceso, sin 
necesidad de realizar el experimento. 

METODO SUBJETIVO: Procedimiento o 
metodo de asignar probabilidades con base en el 
juicio personal. 

METODO A MANO LIBRE: Denominado 
metodo “mano alzada” utilizado para describir una 
serie de tiempo, en el cual la tendencia se estima 
trazando a mano libre de manera que pase cerca 
de los punto originales. Es un metodo subjetivo y 
su validez depende del conocimiento que se tenga 
respecto a esa variable. Es usado en econometria. 

METODO DE INFORMACION LIMITADA: 

No toma en cuenta ciertas restricciones impuestas 
sobre los parametros por las ecuaciones 


estructurales, pero no obstante proporcionan 
estimadores consistentes. 

METODO DEL MAXIMO DE VEROSIMI- 
LITUD: Metodo utilizado para la estimacion de 
un parametro o de varios de una poblacion por 
medio del valor que maximiza (o maximizan) a la 
verosimilitud de una muestra. 

METODO DE LAS MEDIAS MOVILES: 

Denominado como promedios moviles. 

METODO DE LOS MINIMOS CUADRADOS: 

Se refiere al hacer un ajuste rectilineo, parabolico o 
exponencial, seleccionar el mejor de ellos, cuando 
la suma de los cuadrados de las diferencias, entre 
los valores de la variable y su estimado es minimo. 

METODO DE LOS SEMI-PROMEDIOS: 

Metodo utilizado para obtener una estimacion 
rapida de una recta, en el cual la serie de tiempo se 
divide en dos partes, de tal manera que cada una 
de ellas contenga un numero impar de periodos, 
calculando la media de cada grupo y su crecimiento 
o decrecimiento esta dado por el promedio de las 
diferencias entre los dos periodos. 

METODOS NO PARAMETRICOS: Cuando 
no se conoce o no se tiene ningun conocimiento 
acerca de los parametros, se habla de metodos 
no parametricos o de distribucion libre y no es 
aplicado cuando se dispone de datos nominales y 
ordinales. 

MODELO: Se considera como la expresion 
formal de una teoria o de la situacion causal 
generadora de los datos observados. 

MODELO LINEAL: En el cual las ecuaciones 
que relacionan a las variables o a las variables 
aleatorias son de forma lineal. 

MODELO MULTIPLICATIVO SERIE DE 
TIEMPO: Cuando una serie esta afectada por 
los cuatro componentes (Tendencia, Variaciones 
Ciclicas; Variaciones Aleatorias y Variaciones 
Estacionales), se multiplican : Y = T x VE x VC 
xVA. 
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MODA: Generalizado en 1984 por K. Pearson. 
Medida de posicion que nos determina aquel 
valor de la variable que mas se repite, es decir, 
aquella que tiene la mayor frecuencia. 

MUESTRA: Parte de una poblacion o subconjunto 
de un conjunto de elementos, que resulta de 
la aplicacion de algun proceso, generalmente 
seleccion deliberada, con el objeto de investigar 
las caracteristicas de la poblacion o conjunto del 
cual proviene. 

MUESTRA ALEATORIA: Muestra que ha 
sido seleccionada por medio de una seleccion 
aleatoria. En ella todos los elementos tienen la 
misma posibilidad de ser seleccionados. 

MUESTRAS APAREADAS: Cada uno de los 
datos de una muestra se compara con el dato 
obtenido en la otra muestra. 

MUESTRA CON BIAS: Es aquella que 
incorpora algun elemento sistematico de error, en 
especial, cuando se confia en el juicio subjetivo 
por parte de los seres humanos. 

MUESTRA CON SELECCION DIRIGIDA: 

Dentro del muestreo no aleatorio, aparece el 
muestreo por cuotas, de juicio o intencional, donde 
las unidades o los elementos son seleccionados 
en forma deliberada, por tal razon esta sujeta a 
errores. 

MUESTRA CON ETAPAS MULTIPLES: 

Conocida como muestreo multietapico, muestreo 
geografico, muestreo por areas y muestreo por 
conglomerados, cuando se tiene una poblacion 
de unidades y se hace una primera seleccion; 
luego cada unidad seleccionada esta compuesta 
por otra cantidad de unidades y se realiza una 
nueva seleccion. Cada unidad seleccionada esta 
compuesta por otras unidades permitiendo una 
nueva seleccion, asi sucesivamente hasta llegar a 
la unidad final o al elemento que se requiere ser 
investigado. 

MUESTRA DEFECTUOSA: Especialmente 
cuando tenemos un marco muestral defectuoso es 


decir, que contiene elementos que no pertenecen 
al estudio o esta incompleto por no haberse 
actualizado. 

MULTICOLINE ALIDAD: Con la aplicacion 
de este termino queremos describir la correlacion 
que hay entre las variables independientes. 

MUESTRA DE DOS ETAPAS: Denominado 
tambien como muestreo bietapico, cuando de una 
poblacion se extrae una muestra aleatoria y luego 
se extrae de ella otra muestra, teniendo en cuenta 
que la unidad cambia en cada etapa de seleccion. 

MUESTRA ESTRATIFICADA: Cuando la 
poblacion ha sido dividida en grupos, estratos o 
subpoblaciones y luego se realiza una muestra 
aleatoria simple en cada uno de los estratos. 
Se puede hacer mediante Afijacion igual, 
proporcional y optima. 

MUESTRA NO ALEATORIA: Cuando los 
elementos o unidades son elegidos capricho- 
samente, pudieramos decir en forma intencional, 
conduciendo a errores, por tal razon se le conoce 
como muestreo erratico o circunstancial. 

MUESTRA POR CUOTAS: Se instruye a cada 
recolector de informacion que recoja un numero 
determinado de elementos de acuerdo a su criterio 
personal, con base en unas consideraciones que se 
le han dado. 

MUESTRA POR FASES: Cuando de una 
poblacion se extrae una muestra lo suficientemente 
grande, que a veces la utilizamos para obtener 
una informacion muy general, luego de ella se 
extrae otra y asi sucesivamente, en este caso, el 
elemento no cambia. 

MUESTRA SIMPLE: Se dice, cuando las 
probabilidades de seleccion de los elementos son 
todas iguales y constantes durante el proceso de 
seleccion. 

MUESTRA SISTEMATICA: Cuando se aplica 
algun metodo sistematico, opuesto a los aleatorios, 
como por ejemplo, cuando la seleccion se hace 
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a intervalos regulares, teniendo en cuenta que la 
primera selection se hace en forma aleatoria. 

MUESTRAS APAREADAS: Donde cada 
elemento de una muestra esta apareado con el 
elemento correspondiente de la (o de cada) otra, 
con respecto a cualidades distintas de aquellas 
inmediatamente sometidas a investigation. 

MUESTRAS INTERPENETRANTES: Cuando 
dos o mas muestras han sido seleccionadas de la 
misma poblacion, mediante el mismo proceso de 
seleccion. 

MUESTRAS INDEPENDIENTES: Son 

muestras que se extraen de dos o mas poblaciones, 
cada una en forma independiente de la otra 

MUESTREO CON REEMPLAZAMIENTO: 

Cuando cada elemento o unidad de muestreo 
es extraida de la poblacion finita y despues de 
registrar sus caracteristicas, se devuelve a la 
poblacion antes de extraer la siguiente unidad, 
pudiendo ser seleccionado nuevamente. 

MUESTREO MIXTO: Cuando un plan de 
muestreo supone el uso de dos o mas metodos de 
muestreo. 

MUESTREO POR CONGLOMERADO: 

Son grupos denominados conglomerados, 
heterogeneos en su composicion interna, pero 
homogeneos al ser comparados entre si, la 
seleccion se hace de uno o mas conglomerados, 
observando el total de conglomerados que se han 
hecho con todos los elementos de la poblacion. 

MUESTREO POR CONVENIENCIA: Se le 

conoce como muestreo intencional, muestreo a 
juicio, donde los elementos son seleccionados en 
forma intencional, a juicio del investigador o por 
conveniencia. 

MUESTREO VOLUNTARIO: Cuando el 
elemento de la muestra, en este caso el informante 
no es seleccionado, sino por voluntad propia para 
el suministro de datos. 



NIVEL DE CONFIANZA: Es una expresion 
alternativa para el coeficiente de confianza, el cual 
se asocia con un estimado por intervalo. 

NIVEL DE SIGNIFICACION: Es el valor que 
se le da a la region critica, cuando realizamos una 
prueba de hipotesis, cuando el valor “Z” o de “t” 
obtenido mediante la variante estadistica, cae en 
esa region se estara rechazando la hipotesis nula. 

NO PARAMETRICO: Denominado como 
distribucion libre, en esos casos no se conoce el 
valor del parametro, ni de otro valor estadistico de 
la poblacion. 

NUMERO INDICE: Es una cifra relativa 
expresada en forma de porcentaje, empleada para 
indicar las variaciones de los precios, cantidades 
y valores de un periodo con respecto a otro que se 
denomina base. 

NUMERO INDICE DE BASE FIJA: Cuando el 
periodo de referencia o base, se mantiene constante 
para los demas periodos. 

NUMERO INDICE DE BASE VARIABLE: 

Se refiere a aquellos en los cuales el periodo 
base de cada indice, corresponde al periodo 
inmediatamente anterior. 

NUMERO INDICE DE BASES ENCADENA- 
DAS: Cuando se tienen indices de base variable 
y se desea transformarlo en indices de base fija, 
con respecto a un periodo, se encadenan mediante 
multiplicaciones sucesivas, de los relativos para 
cada periodo. 

NUMERO INDICE DE CANTIDADES: Intenta 
indicar los cambios de las cantidades producidas, 
vendidas o adquiridas, entre dos o mas periodos, 
independientemente de los cambios en los precios 
o valores unitarios. 
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NUMERO INDICE DE PRECIOS: Intenta 
indicar las variaciones de los precios o 
valores unitarios, entre dos o mas periodos, 
independientemente de los cambios en las 
cantidades. 

NUMERO INDICE PONDERADO: Deno- 
minado tambien como indices de Peso “fijos”. 
Estos indices utilizan ponderaciones que pueden 
ser precios o cantidades, donde cada ponderacion 
representa el peso de importancia dentro del 
conjunto. 

NUMEROS ALEATORIOS: Conjunto de 
numeros utilizados para la seleccion de muestras 
aleatorias. 



OJIVA: Grafico utilizado para representar 
una variable continua, cuya ordenada u eje 
vertical corresponde a las frecuencias absolutas 
acumuladas y en el eje horizontal o abscisas se 
encuentran los intervalos de la variable. 

OSCILACION: Algunos la consideran como 
una medida de dispersion, siendo la diferencia 
obtenida entre el valor maximo y minimo que 
toma la variable. 



PARAMETRO: Son valores obtenidos con 
medidas (promedios, etc.), que han sido aplicadas 
a las caracteristicas de los elementos o unidades, 
que constituyen la poblacion objetivo. 

PERCENTILES: Percentilos o Centilos, es 
un conjunto de valores obtenidos al dividir 
la frecuencia total en cien partes iguales. Por 


ejemplo: el P 30 quiere decir que es un valor de la 
variable, que supera al 30% de las observaciones 
y es superado por el restante 70%. 

PERIODO BASE: En los numeros indices, 
corresponde al periodo que se toma como 
referencia, para indicar las variaciones que se 
presentan en los precios, cantidades y valores con 
respecto a otros periodos. En las series de tiempo 
tambien hay un periodo base, en el analisis de la 
regresion unilateral. 

PERIODO DADO: Corresponde a un periodo 
anterior o posterior al periodo base. 

PERIODO DE REFERENCIA: Es sinonimo de 
periodo base. 

PICTOGRAMA: Es un metodo de representacion 
grafica, por medio de figuras como: casas, carros, 
barcos, personas, etc., cada uno de ellos representa 
un valor. 

PLAN DE MUESTRA: Corresponde a todo el 
proceso de la investigacion, desde la formulacion 
del problema, el objetivo o finalidad de la 
investigacion, diseno de la muestra, hasta su 
publication. 

POBLACION: Colectivo finito o infinito de 
elementos. Conjunto de medidas o recuento de 
elementos que tienen una caracteristica comun. 
Ver Universo. Poblacion objetivo. 

POBLACION FINITA: Poblacion con un 
numero limitado de elementos. 

POBLACION HIPOTETICA: Poblacion 
estadistica que no tiene existencia real. 

POBLACION INFINITA: Colectivo con un 
numero ilimitado de elementos. Poblacion finita 
con reposition de cada elemento que ha sido 
extraido o relacionado. 

POBLACION NO NORMAL: Poblacion para 
la cual, la distribucion de frecuencias no tiene un 
comportamiento igual al de la distribucion normal. 
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POLIGONO DE FRECUENCIAS: Diagrama 
mediante la cual visualizamos una distribution 
continua de frecuencias, ubicando las marcas 
de clase en las abscisas y las frecuencias en la 
ordenadas, que unidas forman una linea poli- 
gonal. 

PONDERACION: Peso o importancia que tiene 
un elemento dentro del conjunto. 

POSICION: Se refiere a las medidas de posicion, 
las cuales permiten determinar un valor tipico que 
represente al conjunto de observaciones. 

POTENCIA: Es la probabilidad de rechazar la 
hipotesis alternativa cuando esta es incorrecta, en 
una prueba de hipotesis. 

PREDICCION: Es el procedimiento que nos 
permite determinar el comportamiento de una 
variable en el futuro, en una serie de tiempo. Ver 
Pronostico. 

PREGUNTAS ABIERTAS: Son preguntas de 
opinion, que permiten un numero ilimitado de 
respuestas. Presentan dificultad en su tabulacion 
o recuento. 

PREGUNTAS CERRADAS: Cuando solo se 
tienen dos posibilidades, cuyas respuestas pueden 
ser clasificadas en las categorias “si o no” 

PROBABILIDAD: Creencia que se tiene de 
que algo puede suceder u ocurrir, es un concepto 
dificil de definir. Se dice de algo probable o una 
medida numerica de la ocurrencia de un suceso. 

PROBABILIDAD A PRIORI: La que se 

puede determinar sin necesidad de realizar el 
experimento, caso contrario a la probabilidad a 
posteriori. 

PROMEDIO: Es un valor que intenta representar 
la caracteristica de un conjunto de valores, como 
tal se entiende a algunas medidas de posicion y 
de tendencia central. Por lo general, algunos lo 
toman como media aritmetica. 


PROMEDIOS MOVILES: Es un procedimiento 
para suavizar una serie de tiempo, tambien 
utilizado como metodo de pronostico y consiste 
en promediar cada grupo sucesivo de datos. 

PROMEDIO PONDERADO: Cuando el 
promedio es calculado, en valores ordenados en 
una tabla de frecuencias, donde cada uno de ellos 
reflejan su importancia dentro del conjunto. 

PRONOSTICO: Tambien se usa el termino 
“Prediccion”, para indicar el comportamiento 
futuro de un hecho. 

PROYECCION: Al tener una serie de tiempo, 
se puede estimar su comportamiento futuro 
(extrapolar), es decir, nos proyectamos para 
periodos venideros. Algunos hablan de pronostico 
como prediccion del comportamiento de una serie 
de tiempo en el futuro. 

PRUEBA BILATERAL: Se refiere a una prueba 
de hipotesis que tiene dos zonas de rechazo o 
dos regiones criticas, que permiten rechazar la 
hipotesis nula (Ho). 

PRUEBA UNILATERAL: Puede localizarse a la 
izquierda, cuando por lo general se quiere probar 
que sea “menor” “inferior”, etc. La region critica 
permite rechazar Ho. Hacia la derecha, cuando 
se emplean los terminos “mayor”, “superior”, 
“mejor”, etc. 

PRUEBA DE LA T: De Wilcoxon, aplicado 
cuando los datos estan dados a escala ordinal y 
las dos muestras se encuentran relacionadas por 
pares o parejas. 

PRUEBA DE MANN-WHITNEY: Es una 

prueba no parametrica, aplicada con el fin de 
determinar las diferencias entre dos poblaciones, 
teniendo como base el analisis de dos muestras 
independientes. 

PRUEBA DE RANGOS Y SIGNOS DE 
WILCOXON: Denominada tambien como 
prueba de rangos y signos de las diferencias 
entre dos poblaciones, con base en dos muestras 
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apareadas, por lo tanto, se realizan pruebas no 
parametricas. 

PRUEBA DE H DE KRUSKAL-WALLIS: 

Esta prueba no parametrica se utiliza para probar 
si tres o mas muestras independientes han sido 
extraidas de poblaciones que presentan la misma 
distribucion. 

PRUEBA DE SIGNO: Pertenece a pruebas 
estadisticas no parametricas la cual nos permite 
identificar diferencias entre dos poblaciones, 
cuyas observaciones se encuentran apareadas 
y a la vez se dispone de datos nominales. Solo 
se toman los signos positivos y negativos de las 
diferencias. 

PRUEBA DE INDEPENDENCES: Cuando 
se tiene una poblacion, de la cual se extrae una 
sola muestra e interesa probar si un atributo o 
clasificacion es independiente del otro. 

PRUEBA DE HOMOGENEIDAD: En este 
caso, se tienen varias poblaciones de las cuales se 
extraen muestras, algunas veces de una muestra se 
obtienen dos o mas categorias, e interesa probar 
si todas ellas presentan una identidad que hagan 
suponer que provienen de una sola poblacion. 

PRUEBA DE LA BONDAD: Se refiere a la 
realizacion de una prueba, con el fin de determinar 
si rechazamos una distribucion hipotetica para 
una poblacion. 

PRUEBA DE CORRELACION POR RAN- 
GOS: Denominada coeficiente de Spearman, 
aplicada para probar si existe asociacion entre 
dos variables, siempre y cuando se logre un nivel 
ordinal de medicion para cada una de las variables. 

PUNTO MUESTRAL: Es un elemento o suceso 
como resultado de un experimento aleatorio en 
condiciones normales. 



RANGO: En algunos casos, se emplea para 
indicar la diferencia entre el valor maximo y 
minimo que toma la variable. Se le denomina 
tambien como “recorrido”; algunos utilizan el 
rango como medida de dispersion y la denominan 
“oscilacion”. 

RANGO INTERCUARTILICO: Es una medida 
de dispersion, calculada mediante la diferencia 
entre el tercer y el primer cuartil. 

RAZON DE MUESTREO: Corresponde a la 
denominada fraccion de muestreo 

(f= n/N). 

REDONDEO: Aproximacion a un numero 
cuando se omiten digitos finales, que pueden ser 
por exceso o por defecto. 

REGION CRITIC A: Tambien denominada 
como zona de rechazo, dependiendo de la prueba 
puede ser unilateral o bilateral. Cuando el valor 
de la variante estadistica (Z, M f 1 o cualquier otro 
valor estadistico de prueba) cae o se localiza en 
esta region se estara rechazando Ho. (Hipotesis 
nula). 

REGION DE ACEPTACION: Cuando la 
prueba estadistica cae en la zona central, se estara 
aceptando la hipotesis nula. 

REGION CRITIC A: Denominada tambien 
como “Region de rechazo”. 

REGLA DE STURGES: Regia empirica, 
utilizada para determinar el numero de intervalos 
o de marcas de clase en una variable continua. 

REGRESION: Utilizado por Galton para indicar 
ciertas relaciones de la herencia biologica; hoy 
utilizado como metodo estadistico, para analizar 
la relacion entre dos o mas variables. Regresion 
bidimensional o bivariante y multivariante. 
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REGRESION EXPONENClAL: Se aplica 
cuando la variable, en una serie de tiempo, presenta 
un crecimiento o decrecimiento geometrico. 
Tambien se aplica en la regresion bilateral. 

REGRESION LINEAL SIMPLE: Es una de las 

maneras de expresion de la regresion, donde dos 
variables estan relacionadas y se aproximan a una 
linea recta. 

REGRESION MULTIPLE: Corresponde a la 
regresion de una variable dependiente en funcion 
de dos o mas variables “independientes”. 

RELATIVOS DE CANTIDADES: Es la 

division (cuociente) entre cantidades del periodo 
investigado y el periodo base. 

RELATIVOS DE PRECIOS: Es la division 
(cuociente) entre los precios del periodo 
investigado y su periodo base. 

REPOSICION: Se emplea el termino en el 
muestreo con reposicion o sin reposicion, en la 
seleccion de los elementos o unidades en una 
muestra. 

RIESGO: Es el valor de equivocacion o 
incumplimiento que se corre en la toma de 
decisiones. 



SELECCION AL AZAR: Es un metodo de 
seleccion de elementos o unidades, de tal manera 
que cada uno de ellos tengan la misma probabilidad 
de ser seleccionado. 

SIMETRIA: Se da cuando los valores de las 
frecuencias absolutas y relativas equidistantes 
de un valor central son iguales. La distribucion 
normal es simetrica, ademas, la media, mediana 
y moda son iguales, ubicandose en el centro de 
la curva. 


SERIE CRONOLOGICA: Es un conjunto de 
observaciones, que se van registrando a medida 
que se producen, en un estricto orden cronologico. 
Tambien se le denomina Serie de Tiempo. 

SERIE DE TIEMPO DESESTACIONALIZA- 

DO: Corresponde a aquella serie de tiempo, al 
cual se le ha eliminado uno de los componentes 
(estacional), dividiendo cada valor original por el 
correspondiente indice estacional. 

SIGNIFICACION: Se dice de una prueba 
de significacion, cuando se intenta verificar la 
hipotesis de que el efecto no existe. Los puntos o 
valores criticos en una prueba reciben el nombre 
de significativos. 

SELECCION SISTEMATICA: Termino o 
punto aleatorio. En el muestreo sistematico los 
elementos se seleccionan a intervalos regulares, 
sin embargo el primer elemento es seleccionado 
al azar y los demas en forma sistematica. 

SESGO: Que hay error. 

SUAVIZACION: Proceso de eliminacion de las 
fluctuaciones en una serie de tiempo utilizando 
para ello totales y promedios moviles. 

SUB-MUESTRA: Es una muestra, obtenida de 
otra muestra. Aplicada en el muestreo por fases 
multiples. 

SUB-MUESTREO: Es utilizado en el proceso de 
seleccion de unidades en el muestreo por etapas y 
en el muestreo por fases. 

SUCESO: Termino utilizado en el resultado de 
una prueba. El conjunto de sucesos constituyen un 
espacio muestral. 

SUCESOS MUTUAMENTE EXCLUYENTES: 

Denominado como la ley de adicion en las 
probabilidades, cuando dos o mas sucesos son 
tales, que solamente uno de ellos puede ocurrir en 
un solo ensayo. 
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SUCESOS INDEPENDIENTES: Cuando 
la presentation de uno de los sucesos no esta 
influenciado por los demas. Denominado tambien 
como Ley multiplicativa. 

SUCESOS DEPENDIENTES: Cuando la 
probabilidad de presentacion del segundo suceso, 
depende de la presentacion del primer suceso; 
el tercero dependera del resultado anterior y asi 
sucesivamente. 



TABLA DE CONTINGENCIA: Es una tabla 
de doble entrada, que permite clasificar las 
caracteristicas, ya sean cualitativas o cuantitativas. 
En ella se resumen las frecuencias reales y las 
esperadas. 

TABLA DE DOS POR DOS: Es una tabla de 
doble entrada, que tiene dos filas y dos columnas. 

TABLA DE FRECUENCIAS: Es una 

manera facil de manejar grandes cantidades de 
informacion, sobre una caracteristica, en un 
cuadro o tabla donde se muestra la frecuencia que 
presenta cada valor que toma la variable. 

TABLA DE VIDA: Forma de representar el 
numero de personas, que de un numero dado de 
nacidos siguen con vida en diferentes edades. 

TAMANO DE LA MUESTRA: Conocido como 
tamano “optimo”, correspondiendo al numero de 
elementos o unidades minimas que debe tener la 
muestra para que sea representativa. 

TASA DE FERTILIDAD: Numero de nacidos 
vivos en un periodo unitario, expresado como 
proporcion del numero de mujeres potencialmente 
fertiles, de la poblacion en ese periodo. 

TASA DE INCIDENCIA: Puede corresponder 
al numero de nuevos casos (de una enfermedad) y 
la poblacion sometida a riesgo. 


TASA DE MORTALIDAD: Numero de 
personas fallecidas en un periodo dado, dividido 
por la poblacion correspondiente al punto medio 
del ano. 

TASA DE NATALIDAD: Es el numero de 
nacimientos vivos registrados en un periodo 
(generalmente un ano), dividido por la poblacion, 
para ese mismo ano, multiplicado todo por 1.000. 
Se conoce tambien como tasa bruta de natalidad. 

TASA DE NO RESPUESTA: Proporcion de 
personas que son seleccionadas en una encuesta y 
se niegan a contestar o responder el cuestionario. 

TENDENCIA: Uno de los cuatro componentes 
de una serie de tiempo. Es un movimiento suave y 
constante, durante un periodo relativamente largo. 
Se representa mediante una funcion matematica, 
que puede ser lineal, parabolica, exponencial, etc. 

TENDENCIA CENTRAL: Manera de 
denominar a las medidas de posicion, con 
tendencia a ubicarse en el centro de la 
distribucion. 

TENDENCIA LINEAL: Cuando la funcion de 
la variable tiempo es lineal. 

TENDENCIA RECTILINEA: Nombre alterna¬ 
tive para la tendencia lineal. 

TEOREMA CENTRAL LIMITE: Cuando 
a una poblacion se le considera que no tiene 
un comportamiento normal y se extraen de ella 
todas las muestras posibles del mismo tamano 
mayor a 30, la distribucion de todas esas medias 
muestrales obtenidas tendran una distribucion 
igual a la normal, aunque la poblacion no la tenga. 

TEOREMADE CHEBYSHEV: Es elporcentaje 
de cualquier conjunto de datos, que deben quedar 
bajo la curva, a uno, dos o tres desviaciones tipicas 
alrededor del promedio, cuando realizamos infe¬ 
rences. 

TEOREMA DE BAYES: Es un metodo o 
procedimiento para el calculo de probabilidades 



GLOSARIO 


815 


posteriores, teniendo como base probabilidades a 
priori. 

TEORIA DE JUEGOS: Es aquella rama de las 
matematicas que tiene que ver con la teoria de los 
resultados, entre dos mas jugadores sometidos a 
normas especificas. 

TOTAL MOVIL: Es la primera parte del 
proceso para calcular el promedio movil, es decir, 
se esta dividiendo al total movil por el numero 
de periodos tornados en el. En cada paso se va 
agregando un nuevo periodo a la suma y se le va 
restando el primero de ese total. Los totales y los 
promedios pueden ser tornados de 3, de 5, 7, etc. 
si se desea trabajar con impares, o de 2, 4, 6 si 
son pares. 



UNIDAD DE MUESTREO: Se habla de unidad 
elemental de muestreo, cuando esta es indivisible 
y simplemente unidad, cuando se puede 
descomponer, es decir, divisible. El conjunto 
se constituye en una poblacion de personas, de 
hogares, de objetos, etc. 

UNIDAD ELEMENTAL: Es la forma mas 
simple, generalmente identificada como elemento, 
en vez de unidad. 

UNIDAD MUESTRAL: Se emplea como 
sinonimo de unidad de muestreo. Se expresa en 
algunos casos, como unidad primaria, unidad de 
segunda etapa, etc. 

UNIMODAL: Forma de describir aquella 
distribucion que solo tiene un valor modal. Si 
hay varios modos, decimos que es bimodal (dos 
modos) o plurimodal (mas de dos). 

UNI VERSO: Termino alternativo de po¬ 
blacion, para algunos cuando contiene varias 
poblaciones. 



VALIDACION: En estadistica es empleada 
como una forma de demostrar que los resultados 
obtenidos a traves de una muestra, son 
representativos de la poblacion y la informacion 
obtenida es exacta. 

VALOR CRITICO: Valor o punto critico que 
se obtiene, dado un nivel de significacion, en una 
prueba de hipotesis, el cual nos permite determinar 
si aceptamos o rechazamos la hipotesis nula. 

VALOR ESPERADO: Tambien conocido 
como esperanza matematica, siendo tambien la 
localizacion central de una variable aleatoria. 

VALORES EXTREMOS: Se entiende como 
el menor y mayor valor que toma la variable, 
correspondiente a un conjunto de observaciones. 

VARIABLE: Cantidad o valor que varia en un 
conjunto de observaciones. 

VARIABLE ALEATORIA: Son los resultados 
que se obtienen de un experimento en condiciones 
normales y varia por ser aleatorio. 

VARIABLE ALEATORIA DISCRETA: Toma 
unicamente valores enteros, es decir, que solo 
asume una sucesion de valores finitos o infinitos. 

VARIABLE ALEATORIA CONTINUA: Varia¬ 
ble aleatoria que solo puede tomar un conjunto 
de valores discontinuos. La variable puede 
tomar valores fraccionados, representados en un 
intervalo o en varios intervalos. 

VARIABLE DEPENDIENTE: Variable que 
se va a predecir. Se denomina tambien como 
predictando. Simbolizada, generalmente por Y. 

VARIACION ESTACIONAL: Otro de los 
cuatro componentes de una serie de tiempo. 
Movimiento ligado con las estaciones del ano, 
sin embargo, puede corresponder a periodos mas 
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cortos, determinandose el inicio y finalizacion del 
mismo, mostrando un comportamiento periodico 
de un ano o menos. 

VARIABLE INDEPENDIENTE: La variable 
que utilizamos para predecir, se le denomina 
tambien Predictor y se simboliza generalmente 
por X. 

VARIACION CICLICA: Variaciones ligadas 
con la economia, que comprende periodos de 
crisis, recuperacion, auge y declinacion en su 
comportamiento. Es otro de los componentes 
de una serie de tiempo, la longitud del ciclo es 
indeterminado. Denominado tambien como 
componente ciclico. 

VARIACION ALEATORIA: Es otro de los 
componentes de una serie de tiempo, la cual se 
ve afectada por variaciones irregulares o factores 
intemos y/o externos no predecibles, tales como: 
inundaciones, paro de trabajadores, falta de 
energia, etc. 

VARIANZA: Medida de dispersion, siendo igual 
a la media de los cuadrados de las diferencias 
entre los valores que toma la variable y su media 
aritmetica. Es decir, la media de las desviaciones 
respecto a su media, elevadas al cuadrado. 


VARIANZA EXPLICADA: Es la media de los 
cuadrados de las diferencias entre los valores 
estimados y su media aritmetica, utilizada en el 
analisis de regresion. 

VARIANZA RESIDUAL: Es la media de los 
cuadrados, de las diferencias entre los valores 
de la variable y los estimados en un analisis de 
regresion. 



ZONA DE ACEPTACION: Generalmente 
denominada como Region de Aceptacion, en la 
realizacion de una prueba de hipotesis. 

ZONA DE RECHAZO: Generalmente 
denominada como Region Critica o Region de 
Rechazo, en una prueba de hipotesis. 

ZONA DE RIESGO: Expresion utilizada 
para senalar la region critica, en una prueba de 
hipotesis. 
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TABLAS 


TA LAI. REAS A 0 LA CURVA NORM AL 
DE PRO A ILIDAD 

A significa el area entre la lmea de simetria (es decir, z = 0) y el valor dado de z. 



z 


0.30 

0.1179 

.31 

.1217 

.32 

.1255 

.33 

.1293 

.34 

.1331 

.35 

.1368 

.36 

.1406 

.37 

.1443 

.38 

.1480 

.39 

.1517 

.40 

.1554 

.41 

.1591 

.42 

.1628 

.43 

.1664 

.44 

.1700 

.45 

.1736 

.46 

.1772 

.47 

.1808 

.48 

.1844 

.49 

.1879 

.50 

.1915 

.51 

.1950 

.52 

.1985 

.53 

.2019 

.54 

.2054 

.55 

.2088 

.56 

.2123 

.57 

.2157 

.58 

.2190 

.59 

.2224 


Z 


0.00 

0.0000 

.01 

.0040 

.02 

.0080 

.03 

.0120 

.04 

.0160 

.05 

.0199 

.06 

.0239 

.07 

.0279 

.08 

.0319 

.09 

.0359 

.10 

.0398 

.11 

.0438 

.12 

.0478 

.13 

.0517 

.14 

.0557 

.15 

.0596 

.16 

.0636 

.17 

.0675 

.18 

.0714 

.19 

.0754 

.20 

.0793 

.21 

.0832 

.22 

.0871 

.23 

.0910 

.24 

.0948 

.25 

.0987 

.26 

.1026 

.27 

.1064 

.28 

.1103 

.29 

.1141 


Z 


0.60 

0.2258 

.61 

.2291 

.62 

.2324 

.63 

.2357 

.64 

.2389 

.65 

.2422 

.66 

.2454 

.67 

.2486 

.68 

.2518 

.69 

.2549 

.70 

.2580 

.71 

.2612 

.72 

.2642 

.73 

.2673 

.74 

.2704 

.75 

.2734 

.76 

.2764 

.77 

.2794 

.78 

.2823 

.79 

.2852 

.80 

.2881 

.81 

.2910 

.82 

.2939 

.83 

.2967 

.84 

.2996 

.85 

.3023 

.86 

.3051 

.87 

.3079 

.88 

.3106 

.89 

.3133 


Z 


0.90 

€?3$59 

.91 

.3186 

.92 

.3212 

.93 

.3238 

.94 

.3264 

.95 

.3289 

.96 

.3315 

.97 

.3340 

.98 

.3365 

.99 

.3389 

1.00 

.3413 

1.01 

.3433 

1.02 

.3461 

1.03 

.3485 

1.04 

.3508 

1.05 

.3531 

1.06 

.3554 

1.07 

.3577 

1.08 

.3599 

1.09 

.3621 

1.10 

.3643 

1.11 

.3665 

1.12 

.3686 

1.13 

.3708 

1.14 

.3729 

1.15 

.3749 

1.16 

.3770 

1.17 

.3790 

1.18 

.3810 

1.19 

.3830 


(*) Tornado de “Introduction to probability and statistics ”. Henry L. Alder, Edward Roesler. W.H. Freeman and. 








































818 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LAI. REAS A 0 LA C URVA NORM AL DE PRO A ILI DAD ( ontinua i n) 


z 


1.90 

0.4713 

1.91 

.4719 

1.92 

.4726 

1.93 

.4732 

1.94 

.4738 

1.95 

.4744 

1.96 

.4750 

1.97 

.4756 

1.98 

.4762 

1.99 

.4767 

2.00 

.4773 

2.01 

.4778 

2.02 

.4783 

2.03 

.4788 

2.04 

.4793 

2.05 

.4798 

2.06 

.4803 

2.07 

.4808 

2.08 

.4812 

2.09 

.4817 

2.10 

.4821 

2.11 

.4826 

2.12 

.4830 

2.13 

.4834 

2.14 

.4838 

2.15 

.4842 

2.16 

.4846 

2.17 

.4850 

2.18 

.4854 

2.19 

.4857 

2.20 

.4861 

2.21 

.4865 

2.22 

.4868 

2.23 

.4871 

2.24 

.4875 


Z 


1.20 

0.3849 

1.21 

.3869 

1.22 

.3888 

1.23 

.3907 

1.24 

.3925 

1.25 

.3944 

1.26 

.3962 

1.27 

.3980 

1.28 

.3997 

1.29 

.4015 

1.30 

.4032 

1.31 

.4049 

1.32 

.4066 

1.33 

.4082 

1.34 

.4099 

1.35 

.4115 

1.36 

.4131 

1.37 

.4147 

1.38 

.4162 

1.39 

.4177 

1.40 

.4192 

1.41 

.4207 

1.42 

.4222 

1.43 

.4236 

1.44 

.4251 

1.45 

.4265 

1.46 

.4279 

1.47 

.4292 

1.48 

.4306 

1.49 

.4319 

1.50 

.4332 

1.51 

.4345 

1.52 

.4357 

1.53 

.4370 

1.54 

.4382 


Z 


2.25 

0.4878 

2.26 

.4881 

2.27 

.4884 

2.28 

.4887 

2.29 

.4890 

2.30 

.4893 

2.31 

.4896 

2.32 

.4898 

2.33 

.4901 

2.34 

.4904 

2.35 

.4906 

2.36 

.4909 

2.37 

.4911 

2.38 

.4913 

2.39 

.4916 

2.40 

.4918 

2.41 

.4920 

2.42 

.4922 

2.43 

.4925 

2.44 

.4927 

2.45 

.4929 

2.46 

.4931 

2.47 

.4932 

2.48 

.4934 

2.49 

.4936 

2.50 

.4938 

2.51 

.4940 

2.52 

.4941 

2.53 

.4943 

2.54 

.4945 

2.55 

.4946 

2.56 

.4948 

2.57 

.4949 

2.58 

.4951 

2.59 

.4952 


Z 


1.55 

0.4394 

1.56 

.4406 

1.57 

.4418 

1.58 

.4430 

1.59 

.4441 

1.60 

.4452 

1.61 

.4463 

1.62 

.4474 

1.63 

.4485 

1.64 

.4495 

1.65 

.4505 

1.66 

.4515 

1.67 

.4525 

1.68 

.4535 

1.69 

.4545 

1.70 

.4554 

1.71 

.4564 

1.72 

.4573 

1.73 

.4582 

1.74 

.4591 

1.75 

.4599 

1.76 

.4608 

1.77 

.4616 

1.78 

.4625 

1.79 

.4633 

1.80 

.4641 

1.81 

.4649 

1.82 

.4656 

1.83 

.4664 

1.84 

.4671 

1.85 

.4678 

1.86 

.4686 

1.87 

.4693 

1.88 

.4700 

1.89 

.4706 
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TA LAI. REAS A 0 LA CURVA NORM AL DE PRO A ILIDAD ( ontinua i n) 


z 


3.30 

0.4995 

3.31 

.4995 

3.32 

.4996 

3.33 

.4996 

3.34 

.4996 

3.35 

.4996 

3.36 

.4996 

3.37 

.4996 

3.38 

.4996 

3.39 

.4997 

3.40 

.4997 

3.41 

.4997 

3.42 

.4997 

3.43 

.4997 

3.44 

.4997 

3.45 

.4997 

3.46 

.4997 

3.47 

.4997 

3.48 

.4998 

3.49 

.4998 

3.50 

.4998 

3.51 

.4998 

3.52 

.4998 

3.53 

.4998 

3.54 

.4998 

3.55 

.4998 

3.56 

.4998 

3.57 

.4998 

3.58 

.4998 

3.59 

.4998 

3.60 

.4998 

3.61 

.4999 

3.62 

.4999 

3.63 

.4999 

3.64 

.4999 


z 


2.60 

0.4953 

2.61 

.4955 

2.62 

.4956 

2.63 

.4957 

2.64 

.4959 

2.65 

.4960 

2.66 

.4961 

2.67 

.4962 

2.68 

.4963 

2.69 

.4964 

2.70 

.4965 

2.71 

.4966 

2.72 

.4967 

2.73 

.4968 

2.74 

.4969 

2.75 

.4970 

2.76 

.4971 

2.77 

.4972 

2.78 

.4973 

2.79 

.4974 

2.80 

.4974 

2.81 

.4975 

2.82 

.4976 

2.83 

.4977 

2.84 

.4977 

2.85 

.4978 

2.86 

.4979 

2.87 

.4980 

2.88 

.4980 

2.89 

.4981 

2.90 

.4981 

2.91 

.4982 

2.92 

.4983 

2.93 

.4983 

2.94 

.4984 


z 


3.65 

0.4999 

3.66 

.4999 

3.67 

.4999 

3.68 

.4999 

3.69 

.4999 

3.70 

.4999 

3.71 

.4999 

3.72 

.4999 

3.73 

.4999 

3.74 

.4999 

3.75 

.4999 

3.76 

.4999 

3.77 

.4999 

3.78 

.4999 

3.79 

.4999 

3.80 

.4999 

3.81 

.4999 

3.82 

.4999 

3.83 

.4999 

3.84 

.4999 

3.85 

.4999 

3.86 

.4999 

3.87 

.5000 

3.88 

.5000 

3.89 

.5000 


z 


2.95 

0.4984 

2.96 

.4985 

2.97 

.4985 

2.98 

.4986 

2.99 

.4986 

3.00 

.4987 

3.01 

.4987 

3.02 

.4987 

3.03 

.4988 

3.04 

.4988 

3.05 

.4989 

3.06 

.4989 

3.07 

.4989 

3.08 

.4990 

3.09 

.4990 

3.10 

.4990 

3.11 

.4991 

3.12 

.4991 

3.13 

.4991 

3.14 

.4992 

3.15 

.4992 

3.16 

.4992 

3.17 

.4992 

3.18 

.4993 

3.19 

.4993 

3.20 

.4993 

3.21 

.4993 

3.22 

.4994 

3.23 

.4994 

3.24 

.4994 

3.25 

.4994 

3.26 

.4994 

3.27 

.4995 

3.28 

.4995 

3.29 

.4995 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA II. DISTRI UCI N t DE STUDENT 

La primera columna senala el numero de grados de libertad (v). El encabezado de las otras columnas da las 
probabilidades (P) de que t exceda numericamente al valor de la tabla. 



0.50 

0.20 

0.10 

0.05 

0.02 

0.01 

0.005 

0.002 

0.001 

1 

1.000 

3.078 

6.314 

12.706 

31.821 

63.657 

127.321 

318.309 

636.619 

2 

0.816 

1.886 

2.920 

4.303 

6.965 

9.925 

14.089 

22.327 

31.599 

3 

0.765 

1.638 

2.353 

3.182 

4.541 

5.841 

7.453 

10.215 

12.924 

4 

0.741 

1.533 

2.132 

2.776 

3.747 

4.604 

5.598 

7.173 

8.610 

5 

0.727 

1.476 

2.015 

2.571 

3.365 

4.032 

4.773 

5.893 

6.869 

6 

0.718 

1.440 

1.943 

2.447 

3.143 

3.707 

4.317 

5.208 

5.959 

7 

0.711 

1.415 

1.895 

2.365 

2.998 

3.499 

4.029 

4.785 

5.408 

8 

0.706 

1.397 

1.860 

2.306 

2.896 

3.355 

3.833 

4.501 

5.041 

9 

0.703 

1.383 

1.833 

2.262 

2.821 

3.250 

3.690 

4.297 

4.781 

10 

0.700 

1.372 

1.812 

2.228 

2.764 

3.169 

3.581 

4.144 

4.587 

11 

0.697 

1.363 

1.796 

2.201 

2.718 

3.106 

3.497 

4.025 

4.437 

12 

0.695 

1.356 

1.782 

2.179 

2.681 

3.055 

3.428 

3.930 

4.318 

13 

0.694 

1.350 

1.771 

2.160 

2.650 

3.012 

3.372 

3.852 

4.221 

14 

0.692 

1.345 

1.761 

2.145 

2.624 

2.977 

3.326 

3.787 

4.140 

15 

0.691 

1.341 

1.753 

2.131 

2.602 

2.947 

3.286 

3.733 

4.073 

16 

0.690 

1.337 

1.746 

2.120 

2.583 

2.921 

3.252 

3.686 

4.015 

17 

0.689 

1.333 

1.740 

2.110 

2.567 

2.898 

3.222 

3.646 

3.965 

18 

0.688 

1.330 

1.734 

2.101 

2.552 

2.878 

3.197 

3.610 

3.922 

19 

0.688 

1.328 

1.729 

2.093 

2.539 

2.861 

3.174 

3.579 

3.883 

20 

0.687 

1.325 

1.725 

2.086 

2.528 

2.845 

3.153 

3.552 

3.850 

21 

0.686 

1.323 

1.721 

2.080 

2.518 

2.831 

3.135 

3.527 

3.819 

22 

0.686 

1.321 

1.717 

2.074 

2.508 

2.819 

3.119 

3.505 

3.792 

23 

0.685 

1.319 

1.714 

2.069 

2.500 

2.807 

3.104 

3.485 

3.768 

24 

0.685 

1.318 

1.711 

2.064 

2.492 

2.797 

3.091 

3.467 

3.745 

25 

0.684 

1.316 

1.708 

2.060 

2.485 

2.787 

3.078 

3.450 

3.725 

26 

0.684 

1.315 

1.706 

2.056 

2.479 

2.779 

3.067 

3.435 

3.707 

27 

0.684 

1.314 

1.703 

2.052 

2.473 

2.771 

3.057 

3.421 

3.690 

28 

0.683 

1.313 

1.701 

2.048 

2.467 

2.763 

3.047 

3.408 

3.674 

29 

0.683 

1.311 

1.699 

2.045 

2.462 

2.756 

3.038 

3.396 

3.659 

30 

0.683 

1.310 

1.697 

2.042 

2.457 

2.750 

3.030 

3.385 

3.646 

31 

0.682 

1.309 

1.696 

2.040 

2.453 

2.744 

3.022 

3.375 

3.633 

32 

0.682 

1.309 

1.694 

2.037 

2.449 

2.738 

3.015 

3.365 

3.622 

33 

0.682 

1.308 

1.692 

2.035 

2.445 

2.733 

3.008 

3.356 

3.611 

34 

0.682 

1.307 

1.691 

2.032 

2.441 

2.728 

3.002 

3.348 

3.601 

35 

0.682 

1.306 

1.690 

2.030 

2.438 

2.724 

2.996 

3.340 

3.591 

36 

0.681 

1.306 

1.688 

2.028 

2.434 

2.719 

2.990 

3.333 

3.582 

37 

0.681 

1.305 

1.687 

2.026 

2.431 

2.715 

2.985 

3.326 

3.574 

38 

0.681 

1.304 

1.686 

2.024 

2.429 

2.712 

2.980 

3.319 

3.566 

39 

0.681 

1.304 

1.685 

2.023 

2.426 

2.708 

2.976 

3.313 

3.558 

40 

0.681 

1.303 

1.684 

2.021 

2.423 

2.704 

2.971 

3.307 

3.551 
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TA LAN. DISTRI UCI N t DE STUDENT ( ontinua i n) 



0.50 

0.20 

0.10 

0.05 

0.02 

0.01 

0.005 

0.002 

0.001 

42 

0.680 

1.302 

1.682 

2.018 

2.418 

2.698 

2.963 

3.296 

3.538 

44 

0.680 

1.301 

1.680 

2.015 

2.414 

2.692 

2.956 

3.286 

3.526 

46 

0.680 

1.300 

1.679 

2.013 

2.410 

2.687 

2.949 

3.277 

3.515 

48 

0.680 

1.299 

1.677 

2.011 

2.407 

2.682 

2.943 

3.269 

3.505 

50 

0.679 

1.299 

1.676 

2.009 

2.403 

2.678 

2.937 

3.261 

3.496 

52 

0.679 

1.298 

1.675 

2.007 

2.400 

2.674 

2.932 

3.255 

3.488 

54 

0.679 

1.297 

1.674 

2.005 

2.397 

2.670 

2.927 

3.248 

3.480 

56 

0.679 

1.297 

1.673 

2.003 

2.395 

2.667 

2.923 

3.242 

3.473 

58 

0.679 

1.296 

1.672 

2.002 

2.392 

2.663 

2.918 

3.237 

3.466 

60 

0.679 

1.296 

1.671 

2.000 

2.390 

2.660 

2.915 

3.232 

3.460 

62 

0.678 

1.295 

1.670 

1.999 

2.388 

2.657 

2.911 

3.227 

3.454 

64 

0.678 

1.295 

1.669 

1.998 

2.386 

2.655 

2.908 

3.223 

3.449 

66 

0.678 

1.295 

1.668 

1.997 

2.384 

2.652 

2.904 

3.218 

3.444 

68 

0.678 

1.294 

1.668 

1.995 

2.382 

2.650 

2.902 

3.214 

3.439 

70 

0.678 

1.294 

1.667 

1.994 

2.381 

2.648 

2.899 

3.211 

3.435 

72 

0.678 

1.293 

1.666 

1.993 

2.379 

2.646 

2.896 

3.207 

3.431 

74 

0.678 

1.293 

1.666 

1.993 

2.378 

2.644 

2.894 

3.204 

3.427 

76 

0.678 

1.293 

1.665 

1.992 

2.376 

2.642 

2.891 

3.201 

3.423 

78 

0.678 

1.292 

1.665 

1.991 

2.375 

2.640 

2.889 

3.198 

3.420 

80 

0.678 

1.292 

1.664 

1.990 

2.374 

2.639 

2.887 

3.195 

3.416 

90 

0.677 

1.291 

1.662 

1.987 

2.368 

2.632 

2.878 

3.183 

3.402 

100 

0.677 

1.290 

1.660 

1.984 

2.364 

2.626 

2.871 

3.174 

3.390 

120 

0.677 

1.289 

1.658 

1.980 

2.358 

2.617 

2.860 

3.160 

3.373 

140 

0.676 

1.288 

1.656 

1.977 

2.353 

2.611 

2.852 

3.149 

3.361 

160 

0.676 

1.287 

1.654 

1.975 

2.350 

2.607 

2.846 

3.142 

3.352 

180 

0.676 

1.286 

1.653 

1.973 

2.347 

2.603 

2.842 

3.136 

3.345 

200 

0.676 

1.286 

1.653 

1.972 

2.345 

2.601 

2.839 

3.131 

3.340 

00 

0.6745 

1.2816 

1.6449 

1.9600 

2.3263 

2.5758 

2.8070 

3.0902 

3.2905 
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Adaptado por J.H. Zar - Analisis bioestadistico - Prentice Hall - Englewood - Clitts - 1974 - pp. 413-414. 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LAIN. DISTRI UCI N INOMIAL 

P = C n x p x q"~ x 




n 

JC 

.05 

.10 

.15 

.20 

.25 

. 0 

. 5 

. 0 

. 5 

.50 

1 

0 

.9500 

.9000 

.8500 

.8000 

.7500 

.7000 

.6500 

.6000 

.5500 

.5000 

1 

.0500 

.1000 

.1500 

.2000 

.2500 

.3000 

.3500 

.4000 

.4500 

.5000 


0 

.9025 

.8100 

.7225 

.6400 

.5625 

.4900 

.4225 

.3600 

.3025 

.2500 

2 

1 

.0950 

.1800 

.2550 

.3200 

.3750 

.4200 

.4550 

.4800 

.4950 

.5000 


2 

.0025 

.0100 

.0225 

.0400 

.0625 

.0900 

.1225 

.1600 

.2025 

.2500 


0 

.8574 

.7290 

.6141 

.5120 

.4219 

.3430 

.2746 

.2160 

.1664 

.1250 

o 

1 

.1354 

.2430 

.3251 

.3840 

.4219 

.4410 

.4436 

.4320 

.4084 

.3750 

J 

2 

.0071 

.0270 

.0574 

.0960 

.1406 

.1890 

.2389 

.2880 

.3341 

.3750 


3 

.0001 

.0010 

.0034 

.0080 

.0156 

.0270 

.0429 

.0640 

.0911 

.1250 


0 

.8145 

.6561 

.5220 

.4096 

.3164 

.2401 

.1785 

.1296 

.0915 

.0625 


1 

.1715 

.2916 

.3685 

.4096 

.4219 

.4116 

.3845 

.3456 

.2995 

.2500 

4 

2 

.0135 

.0486 

.0975 

.1536 

.2109 

.2646 

.3105 

.3456 

.3675 

.3750 


3 

.0005 

.0036 

.0115 

.0256 

.0469 

.0756 

.1115 

.1536 

.2005 

.2500 


4 

.0000 

.0001 

.0005 

.0016 

.0039 

.0081 

.0150 

.0256 

.0410 

.0625 


0 

.7738 

.5905 

.4437 

.3277 

.2373 

.1681 

.1160 

.0778 

.0503 

.0312 


1 

.2036 

.3280 

.3915 

.4096 

.3955 

.3602 

.3124 

.2592 

.2059 

.1562 

c 

2 

.0214 

.0729 

.1382 

.2048 

.2637 

.3087 

.3364 

.3456 

.3369 

.3125 

J 

3 

.0011 

.0081 

.0244 

.0512 

.0879 

.1323 

.1811 

.2304 

.2757 

.3125 


4 

.0000 

.0004 

.0022 

.0064 

.0146 

.0284 

.0488 

.0768 

.1128 

.1562 


5 

.0000 

.0000 

.0001 

.0003 

.0010 

.0024 

.0053 

.0102 

.0185 

.0312 


0 

.7351 

.5314 

.3771 

.2621 

.1780 

.1176 

.0754 

.0467 

.0277 

.0156 


1 

.2321 

.3543 

.3993 

.3932 

.3560 

.3025 

.2437 

.1866 

.1359 

.0938 


2 

.0305 

.0984 

.1762 

.2458 

.2966 

.3241 

.3280 

.3110 

.2780 

.2344 

6 

3 

.0021 

.0146 

.0415 

.0819 

.1318 

.1852 

.2355 

.2765 

.3032 

.3125 


4 

.0001 

.0012 

.0055 

.0154 

.0330 

.0595 

.0951 

.1382 

.1861 

.2344 


5 

.0000 

.0001 

.0004 

.0015 

.0044 

.0102 

.0205 

.0369 

.0609 

.0938 


6 

.0000 

.0000 

.0000 

.0001 

.0002 

.0007 

.0018 

.0041 

.0083 

.0156 


0 

.6983 

.4783 

.3206 

.2097 

.1335 

.0824 

.0490 

.0280 

.0152 

.0078 


1 

.2573 

.3720 

.3960 

.3670 

.3115 

.2471 

.1848 

.1306 

.0872 

.0547 


2 

.0406 

.1240 

.2097 

.2753 

.3115 

.3177 

.2985 

.2613 

.2140 

.1641 

7 

3 

.0036 

.0230 

.0617 

.1147 

.1730 

.2269 

.2679 

.2903 

.2918 

.2734 

/ 

4 

.0002 

.0026 

.0109 

.0287 

.0577 

.0972 

.1442 

.1935 

.2388 

.2734 


5 

.0000 

.0002 

.0012 

.0043 

.0115 

.0250 

.0466 

.0774 

.1172 

.1641 


6 

.0000 

.0000 

.0001 

.0004 

.0013 

.0036 

.0084 

.0172 

.0320 

.0547 


7 

.0000 

.0000 

.0000 

.0000 

.0001 

.0002 

.0006 

.0016 

.0037 

.0078 


























GLOSARIO 


823 


TA LAIN. DISTRI UCI N INOMIAL ( ontinua i n) 




n 

X 

.05 

.10 

.15 

.20 

.25 

. 0 

. 5 

. 0 

. 5 

.50 


0 

.6634 

.4305 

.2725 

.1678 

.1001 

.0576 

.0319 

.0168 

.0084 

.0039 


1 

.2793 

.3825 

.3847 

.3355 

.2670 

.1977 

.1373 

.0896 

.0548 

.0312 


2 

.0515 

.1488 

.2376 

.2936 

.3115 

.2965 

.2587 

.2000 

.1569 

.1094 


3 

.0054 

.0331 

.0839 

.1468 

.2076 

.2541 

.2786 

.2787 

.2568 

.2188 

8 

4 

.0004 

.0046 

.0185 

.0459 

.0865 

.1361 

.1875 

.2322 

.2627 

.2734 


5 

.0000 

.0004 

.0026 

.0092 

.0231 

.0467 

.0808 

.1239 

.1719 

.2188 


6 

.0000 

.0000 

.0002 

.0011 

.0038 

.0100 

.0217 

.0413 

.0703 

.1094 


7 

.0000 

.0000 

.0000 

.0001 

.0004 

.0012 

.0033 

.0079 

.0164 

.0312 


8 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0002 

.0007 

.0017 

.0039 


0 

.6302 

.3874 

.2316 

.1342 

.0751 

.0404 

.0207 

.0101 

.0046 

.0020 


1 

.2985 

.3874 

.3679 

.3020 

.2253 

.1556 

.1004 

.0605 

.0339 

.0176 


2 

.0629 

.1722 

.2597 

.3020 

.3003 

.2668 

.2162 

.1612 

.1110 

.0703 


3 

.0077 

.0446 

.1069 

.1762 

.2336 

.2668 

.2716 

.2508 

.2119 

.1641 

9 

4 

.0006 

.0074 

.0283 

.0661 

.1168 

.1715 

.2194 

.2508 

.2600 

.2461 

5 

.0000 

.0008 

.0050 

.0165 

.0389 

.0735 

.1181 

.1672 

.2128 

.2461 


6 

.0000 

.0001 

.0006 

.0028 

.0087 

.0210 

.0421 

.0743 

.1160 

.1641 


7 

.0000 

.0000 

.0000 

.0003 

.0012 

.0039 

.0098 

.0212 

.0407 

.0703 


8 

.0000 

.0000 

.0000 

.0000 

.0001 

.0004 

.0018 

.0035 

.0083 

.0176 


9 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0003 

.0008 

.0020 


0 

.5987 

.3487 

.1969 

.1074 

.0563 

.0282 

.0135 

.0060 

.0025 

.0010 


1 

.3151 

.3874 

.3474 

.2684 

.1877 

.1211 

.0723 

.0403 

.0207 

.0098 


2 

.0746 

.1937 

.2759 

.3020 

.2816 

.2335 

.1757 

.1209 

.0763 

.0439 


3 

.0105 

.0574 

.1298 

.2013 

.2503 

.2668 

.2522 

.2150 

.1665 

.1172 


4 

.0010 

.0112 

.0401 

.0881 

.1460 

.2001 

.2377 

.2508 

.2384 

.2051 

10 

5 

.0001 

.0015 

.0085 

.0264 

.0584 

.1029 

.1536 

.2007 

.2340 

.2461 


6 

.0000 

.0001 

.0012 

.0055 

.0162 

.0368 

.0689 

.1115 

.1596 

.2051 


7 

.0000 

.0000 

.0001 

.0008 

.0031 

.0090 

.0212 

.0425 

.0746 

.1172 


8 

.0000 

.0000 

.0000 

.0001 

.0004 

.0014 

.0043 

.0106 

.0229 

.0439 


9 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0016 

.0042 

.0098 


10 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0003 

.0010 


0 

.5688 

.3138 

.1673 

.0859 

.0422 

.0198 

.0088 

.0036 

.0014 

.0005 


1 

.3293 

.3835 

.3248 

.2362 

.1549 

.0932 

.0518 

.0266 

.0125 

.0054 


2 

.0867 

.2131 

.2866 

.2953 

.2581 

.1998 

.1395 

.0887 

.0513 

.0269 


3 

.0137 

.0710 

.1517 

.2215 

.2581 

.2568 

.2254 

.1774 

.1259 

.0806 


4 

.0014 

.0158 

.0536 

.1107 

.1721 

.2201 

.2428 

.2365 

.2060 

.1611 

11 

5 

.0001 

.0025 

.0132 

.0388 

.0803 

.1321 

.1830 

.2207 

.2360 

.2256 

6 

.0000 

.0003 

.0023 

.0097 

.0268 

.0566 

.0985 

.1471 

.1931 

.2256 


7 

.0000 

.0000 

.0003 

.0017 

.0064 

.0173 

.0379 

.0701 

.1128 

.1611 


8 

.0000 

.0000 

.0000 

.0002 

.0011 

.0037 

.0102 

.0234 

.0462 

.0806 


9 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0018 

.0052 

.0126 

.0269 


10 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0007 

.0021 

.0054 


11 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0005 























824 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LAIN. DISTRI UCI N INOMIAL ( ontinua i n) 




n 

X 

.05 

.10 

.15 

.20 

.25 

. 0 

. 5 

. 0 

. 5 

.50 


0 

.5404 

.2824 

.1422 

.0687 

.0317 

.0138 

.0057 

.0022 

.0008 

.0002 


1 

.3413 

.3766 

.3012 

.2062 

.1267 

.0712 

.0368 

.0174 

.0075 

.0029 


2 

.0988 

.2301 

.2924 

.2835 

.2323 

.1678 

.1088 

.0639 

.0339 

.0161 


3 

.0173 

.0852 

.1720 

.2362 

.2581 

.2397 

.1954 

.1419 

.0923 

.0537 


4 

.0021 

.0213 

.0683 

.1329 

.1936 

.2311 

.2367 

.2128 

.1700 

.1208 


5 

.0002 

.0038 

.0193 

.0532 

.1032 

.1585 

.2039 

.2270 

.2225 

.1934 

12 

6 

.0000 

.0005 

.0040 

.0155 

.0401 

.0792 

.1281 

.1766 

.2124 

.2256 


7 

.0000 

.0000 

.0006 

.0033 

.0115 

.0291 

.0591 

.1009 

.1489 

.1934 


8 

.0000 

.0000 

.0001 

.0005 

.0024 

.0078 

.0199 

.0420 

.0762 

.1208 


9 

.0000 

.0000 

.0000 

.0001 

.0004 

.0015 

.0048 

.0125 

.0277 

.0537 


10 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0008 

.0025 

.0068 

.0161 


11 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0003 

.0010 

.0029 


12 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0002 


0 

.5133 

.2542 

.1209 

.0550 

.0238 

.0097 

.0037 

.0013 

.0004 

.0001 


1 

.3512 

.3672 

.2774 

.1787 

.1029 

.0540 

.0259 

.0113 

.0045 

.0016 


2 

.1109 

.2448 

.2937 

.2680 

.2059 

.1388 

.0836 

.0453 

.0220 

.0095 


3 

.0214 

.0997 

.1900 

.2457 

.2517 

.2181 

.1651 

.1107 

.0660 

.0349 


4 

.0028 

.0277 

.0838 

.1535 

.2097 

.2337 

.2222 

.1845 

.1350 

.0873 


5 

.0003 

.0055 

.0266 

.0691 

.1258 

.1803 

.2154 

.2214 

.1989 

.1571 


6 

.0000 

.0008 

.0063 

.0230 

.0559 

.1030 

.1546 

.1968 

.2169 

.2095 

1 J 

7 

.0000 

.0001 

.0011 

.0058 

.0186 

.0442 

.0833 

.1312 

.1775 

.2095 


8 

.0000 

.0000 

.0001 

.0011 

.0047 

.0142 

.0336 

.0656 

.1089 

.1571 


9 

.0000 

.0000 

.0000 

.0001 

.0009 

.0034 

.0101 

.0243 

.0495 

.0873 


10 

.0000 

.0000 

.0000 

.0000 

.0001 

.0006 

.0022 

.0065 

.0162 

.0349 


11 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0012 

.0036 

.0095 


12 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0016 


13 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 


0 

.4877 

.2288 

.1028 

.0440 

.0178 

.0068 

.0024 

.0008 

.0002 

.0001 


1 

.3593 

.3559 

.2539 

.1539 

.0832 

.0407 

.0181 

.0073 

.0027 

.0009 


2 

.1229 

.2570 

.2912 

.2501 

.1802 

.1134 

.0634 

.0317 

.0141 

.0056 


3 

.0259 

.1142 

.2056 

.2501 

.2402 

.1943 

.1366 

.0845 

.0462 

.0222 


4 

.0037 

.0348 

.0998 

.1720 

.2202 

.2290 

.2022 

.1549 

.1040 

.0611 


5 

.0004 

.0078 

.0352 

.0860 

.1468 

.1963 

.2178 

.2066 

.1701 

.1222 


6 

.0000 

.0013 

.0093 

.0322 

.0734 

.1262 

.1759 

.2066 

.2088 

.1833 

14 

7 

.0000 

.0002 

.0019 

.0092 

.0280 

.0618 

.1082 

.1574 

.1952 

.2095 


8 

.0000 

.0000 

.0003 

.0020 

.0082 

.0232 

.0510 

.0918 

.1398 

.1833 


9 

.0000 

.0000 

.0000 

.0003 

.0018 

.0066 

.0183 

.0408 

.0762 

.1222 


10 

.0000 

.0000 

.0000 

.0000 

.0003 

.0014 

.0049 

.0136 

.0312 

.0611 


11 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0010 

.0033 

.0093 

.0222 


12 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0019 

.0056 


13 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0002 

.0009 


14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 






















GLOSARIO 


825 


TA LAIN. DISTRI UCI N INOMIAL ( ontinua i n) 




n 

X 

.05 

.10 

.15 

.20 

.25 

. 0 

. 5 

. 0 

. 5 

.50 


0 

.4633 

.2059 

.0874 

.0352 

.0134 

.0047 

.0016 

.0005 

.0001 

.0000 


1 

.3658 

.3432 

.2312 

.1319 

.0668 

.0305 

.0126 

.0047 

.0016 

.0005 


2 

.1348 

.2669 

.2856 

.2309 

.1559 

.0916 

.0476 

.0219 

.0090 

.0032 


3 

.0307 

.1285 

.2184 

.2501 

.2252 

.1700 

.1110 

.0634 

.0318 

.0139 


4 

.0049 

.0428 

.1156 

.1876 

.2252 

.2186 

.1792 

.1268 

.0780 

.0417 


5 

.0006 

.0105 

.0449 

.1032 

.1651 

.2061 

.2123 

.1859 

.1404 

.0916 


6 

.0000 

.0019 

.0132 

.0430 

.0917 

.1472 

.1906 

.2066 

.1914 

.1527 

15 

7 

.0000 

.0003 

.0030 

.0138 

.0393 

.0811 

.1319 

.1771 

.2013 

.1964 

8 

.0000 

.0000 

.0005 

.0035 

.0131 

.0348 

.0710 

.1181 

.1647 

.1964 


9 

.0000 

.0000 

.0001 

.0007 

.0034 

.0116 

.0298 

.0612 

.1048 

.1527 


10 

.0000 

.0000 

.0000 

.0001 

.0007 

.0030 

.0096 

.0245 

.0515 

.0916 


11 

.0000 

.0000 

.0000 

.0000 

.0001 

.0006 

.0024 

.0074 

.0191 

.0417 


12 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0004 

.0016 

.0052 

.0139 


13 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0003 

.0010 

.0032 


14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 


15 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


0 

.4401 

.1853 

.0743 

.0281 

.0100 

.0033 

.0010 

.0003 

.0001 

.0000 


1 

.3706 

.3294 

.2097 

.1126 

.0535 

.0228 

.0087 

.0030 

.0009 

.0002 


2 

.1463 

.2745 

.2775 

.2111 

.1336 

.0732 

.0353 

.0150 

.0056 

.0018 


3 

.0359 

.1423 

.2285 

.2463 

.2079 

.1465 

.0888 

.0468 

.0215 

.0085 


4 

.0061 

.0514 

.1311 

.2001 

.2252 

.2040 

.1553 

.1014 

.0572 

.0278 


5 

.0008 

.0137 

.0555 

.1201 

.1802 

.2099 

.2008 

.1623 

.1123 

.0667 


6 

.0001 

.0028 

.0180 

.0550 

.1101 

.1649 

.1982 

.1983 

.1684 

.1222 


7 

.0000 

.0004 

.0045 

.0197 

.0524 

.1010 

.1524 

.1889 

.1969 

.1746 

16 

8 

.0000 

.0001 

.0009 

.0055 

.0197 

.0487 

.0923 

.1417 

.1812 

.1964 


9 

.0000 

.0000 

.0001 

.0012 

.0058 

.0185 

.0442 

.0840 

.1318 

.1746 


10 

.0000 

.0000 

.0000 

.0002 

.0014 

.0056 

.0167 

.0392 

.0755 

.1222 


11 

.0000 

.0000 

.0000 

.0000 

.0002 

.0013 

.0049 

.0142 

.0337 

.0667 


12 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0011 

.0040 

.0115 

.0278 


13 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0008 

.0029 

.0085 


14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0018 


15 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0002 


16 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


0 

.4181 

.1668 

.0631 

.0225 

.0075 

.0023 

.0007 

.0002 

.0000 

.0000 


1 

.3741 

.3150 

.1893 

.0957 

.0426 

.0169 

.0060 

.0019 

.0005 

.0001 


2 

.1575 

.2800 

.2673 

.1914 

.1136 

.0581 

.0260 

.0102 

.0035 

.0010 

17 

3 

.0415 

.1556 

.2359 

.2393 

.1893 

.1245 

.0701 

.0341 

.0144 

.0052 


4 

.0076 

.0605 

.1457 

.2093 

.2209 

.1868 

.1320 

.0796 

.0411 

.0182 


5 

.0010 

.0175 

.0668 

.1361 

.1914 

.2081 

.1849 

.1379 

.0875 

.0472 


6 

.0001 

.0039 

.0236 

.0680 

.1276 

.1784 

.1991 

.1839 

.1432 

.0944 






















826 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA III. DISTRI UCI N INOMIAL ( ontinua i n) 














n 

X 

.05 

.10 

.15 

.20 

.25 

. 0 

. 5 

. 0 

. 5 

.50 


7 

.0000 

.0007 

.0065 

.0267 

.0668 

.1201 

.1685 

.1927 

.1841 

.1484 


8 

.0000 

.0001 

.0014 

.0084 

.0279 

.0644 

.1134 

.1606 

.1883 

.1855 


9 

.0000 

.0000 

.0003 

.0021 

.0093 

.0276 

.0611 

.1070 

.1540 

.1855 


10 

.0000 

.0000 

.0000 

.0004 

.0025 

.0095 

.0263 

.0571 

.1008 

.1484 


11 

.0000 

.0000 

.0000 

.0001 

.0005 

.0026 

.0090 

.0242 

.0525 

.0944 

17 

12 

.0000 

.0000 

.0000 

.0000 

.0001 

.0006 

.0024 

.0081 

.0215 

.0472 


13 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0021 

.0068 

.0182 


14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0004 

.0016 

.0052 


15 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0003 

.0010 


16 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 


17 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


0 

.3972 

.1501 

.0536 

.0180 

.0056 

.0016 

.0004 

.0001 

.0000 

.0000 


1 

.3763 

.3002 

.1704 

.0811 

.0338 

.0126 

.0042 

.0012 

.0003 

.0001 


2 

.1683 

.2835 

.2556 

.1723 

.0958 

.0458 

.0190 

.0069 

.0022 

.0006 


3 

.0473 

.1680 

.2406 

.2297 

.1704 

.1046 

.0547 

.0246 

.0095 

.0031 


4 

.0093 

.0700 

.1592 

.2153 

.2130 

.1681 

.1104 

.0614 

.0291 

.0117 


5 

.0014 

.0218 

.0787 

.1507 

.1988 

.2017 

.1664 

.1146 

.0666 

.0327 


6 

.0002 

.0052 

.0301 

.0816 

.1436 

.1873 

.1941 

.1655 

.1181 

.0708 


7 

.0000 

.0010 

.0091 

.0350 

.0820 

.1376 

.1792 

.1892 

.1657 

.1214 


8 

.0000 

.0002 

.0022 

.0120 

.0376 

.0811 

.1327 

.1734 

.1864 

.1669 

18 

9 

.0000 

.0000 

.0004 

.0033 

.0139 

.0386 

.0794 

.1284 

.1694 

.1855 


10 

.0000 

.0000 

.0001 

.0008 

.0042 

.0149 

.0385 

.0771 

.1248 

.1669 


11 

.0000 

.0000 

.0000 

.0001 

.0010 

.0046 

.0151 

.0374 

.0742 

.1214 


12 

.0000 

.0000 

.0000 

.0000 

.0002 

.0012 

.0047 

.0145 

.0354 

.0708 


13 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0012 

.0045 

.0134 

.0327 


14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0011 

.0039 

.0117 


15 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0009 

.0031 


16 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0006 


17 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 


18 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


0 

.3774 

.1351 

.0456 

.0144 

.0042 

.0011 

.0003 

.0001 

.0000 

.0000 


1 

.3774 

.2852 

.1529 

.0685 

.0268 

.0093 

.0029 

.0008 

.0002 

.0000 


2 

.1787 

.2852 

.2428 

.1540 

.0803 

.0358 

.0138 

.0046 

.0013 

.0003 


3 

.0533 

.1796 

.2428 

.2182 

.1517 

.0869 

.0422 

.0175 

.0062 

.0018 

19 

4 

.0112 

.0798 

.1714 

.2182 

.2023 

.1491 

.0909 

.0467 

.0203 

.0074 


5 

.0018 

.0266 

.0907 

.1636 

.2023 

.1916 

.1468 

.0933 

.0497 

.0222 


6 

.0002 

.0069 

.0374 

.0955 

.1574 

.1916 

.1844 

.1451 

.0949 

.0518 


7 

.0000 

.0014 

.0122 

.0443 

.0974 

.1525 

.1844 

.1797 

.1443 

.0961 


8 

.0000 

.0002 

.0032 

.0166 

.0487 

.0981 

.1489 

.1797 

.1771 

.1462 


9 

.0000 

.0000 

.0007 

.0051 

.0198 

.0514 

.0980 

.1464 

.1771 

.1762 
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TA LA III. DISTRI UCI N INOMIAL ( ontinua i n) 




n 

X 

.05 

.10 

.15 

.20 

.25 

. 0 

. 5 

. 0 

. 5 

.50 


10 

.0000 

.0000 

.0001 

.0013 

.0066 

.0220 

.0528 

.0976 

.1449 

.1762 


11 

.0000 

.0000 

.0000 

.0003 

.0018 

.0077 

.0233 

.0532 

.0970 

.1462 


12 

.0000 

.0000 

.0000 

.0000 

.0004 

.0022 

.0083 

.0237 

.0529 

.0961 


13 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0024 

.0085 

.0233 

.0518 

19 

14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0006 

.0024 

.0082 

.0222 

15 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0022 

.0074 


16 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0005 

.0018 


17 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0001 

.0003 


18 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


19 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


0 

.3585 

.1216 

.0388 

.0115 

.0032 

.0008 

.0002 

.0000 

.0000 

.0000 


1 

.3774 

.2702 

.1368 

.0576 

.0211 

.0068 

.0020 

.0005 

.0001 

.0000 


2 

.1887 

.2852 

.2293 

.1369 

.0669 

.0278 

.0100 

.0031 

.0008 

.0002 


3 

.0596 

.1901 

.2428 

.2054 

.1339 

.0716 

.0323 

.0123 

.0040 

.0011 


4 

.0133 

.0898 

.1821 

.2182 

.1897 

.1304 

.0738 

.0350 

.0139 

.0046 


5 

.0022 

.0319 

.1028 

.1746 

.2023 

.1789 

.1272 

.0746 

.0365 

.0148 


6 

.0003 

.0089 

.0454 

.1091 

.1686 

.1916 

.1712 

.1244 

.0746 

.0370 


7 

.0000 

.0020 

.0160 

.0545 

.1124 

.1643 

.1844 

.1659 

.1221 

.0739 


8 

.0000 

.0004 

.0046 

.0222 

.0609 

.1144 

.1614 

.1797 

.1623 

.1201 


9 

.0000 

.0001 

.0011 

.0074 

.0271 

.0654 

.1158 

.1597 

.1771 

.1602 

20 

10 

.0000 

.0000 

.0002 

.0020 

.0099 

.0308 

.0686 

.1171 

.1593 

.1762 


11 

.0000 

.0000 

.0000 

.0005 

.0030 

.0120 

.0336 

.0710 

.1185 

.1602 


12 

.0000 

.0000 

.0000 

.0001 

.0008 

.0039 

.0136 

.0355 

.0727 

.1201 


13 

.0000 

.0000 

.0000 

.0000 

.0002 

.0010 

.0045 

.0146 

.0366 

.0739 


14 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0012 

.0049 

.0150 

.0370 


15 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0003 

.0013 

.0049 

.0148 


16 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0003 

.0013 

.0046 


17 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 

.0011 


18 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0002 


19 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 


20 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 

.0000 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA IV. DISTRI UCI N DE CUADRADO 

i 

REAS A 0 LACURVANORMAL DE PRO A ILIDAD 

A significa el area del extremo derecho para los valores x 2 que aparecen en la tabla. v significa 
el numero de grados de libertad. 



= 0 

= 0 

= 0 5 

= 0 0 

= 0 0 

= 0 0 

= 0 50 

1 

.00016 

.00063 

.0039 

.016 

.064 

.15 

.46 

2 

.02 

.04 

.10 

.21 

.45 

.71 

1.39 

3 

.12 

.18 

.35 

.58 

1.00 

1.42 

2.37 

4 

.30 

.43 

.71 

1.06 

1.65 

2.20 

3.36 

5 

.55 

.75 

1.14 

1.61 

2.34 

3.00 

4.35 

6 

.67 

1.13 

1.64 

2.20 

3.07 

3.83 

5.35 

7 

1.24 

1.56 

2.17 

2.83 

3.82 

4.67 

6.35 

8 

1.65 

2.03 

2.73 

3.49 

4.59 

5.53 

7.34 

9 

2.09 

2.53 

3.32 

4.17 

5.38 

6.39 

8.34 

10 

2.56 

3.06 

3.94 

4.86 

6.18 

7.27 

9.34 

11 

3.05 

3.61 

4.53 

5.58 

6.99 

8.15 

10.34 

12 

3.57 

4.18 

5.23 

6.30 

7.81 

9.03 

11.34 

13 

4.11 

4.76 

5.89 

7.04 

8.63 

9.93 

12.34 

14 

4.66 

5.37 

6.57 

7.79 

9.47 

10.82 

13.34 

15 

5.23 

5.98 

7.26 

6.55 

10.31 

11.72 

14.34 

16 

5.81 

6.61 

7.96 

9.31 

11.15 

12.62 

15.34 

17 

6.41 

7.26 

8.67 

10.08 

12.00 

13.53 

16.34 

18 

7.02 

7.91 

9.39 

10.86 

12.86 

14.44 

17.34 

19 

7.63 

8.57 

10.12 

11.65 

13.72 

15.35 

18.34 

20 

8.26 

9.24 

10.85 

12.44 

14.58 

16.27 

19.34 

21 

8.90 

9.92 

11.59 

13.24 

15.44 

17.18 

20.34 

22 

9.54 

10.60 

12.34 

14.04 

16.31 

18.10 

21.34 

23 

10.20 

11.29 

13.09 

14.85 

17.19 

19.02 

22.34 

24 

10.86 

11.99 

13.85 

15.66 

18.06 

19.94 

23.34 

25 

11.52 

12.70 

14.61 

16.47 

18.94 

20.87 

24.34 

26 

12.20 

13.41 

15.38 

17.29 

19.82 

21.78 

25.34 

27 

12.88 

14.12 

16.15 

18.11 

20.70 

22.72 

26.34 

28 

13.56 

14.85 

16.93 

18.94 

21.59 

23.65 

27.34 

29 

14.26 

15.57 

17.71 

19.77 

22.48 

24.58 

28.34 

30 

14.95 

16.31 

18.49 

20.60 

23.36 

25.51 

29.34 
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TA LA IV. DISTRI UCI N DE .CUADRADO ( ontinua i n) 



= 0 0 

= 0 20 

= 010 

= 005 

= 002 

= 0 01 

= 0001 

1 

1.07 

1.64 

2.71 

3.84 

5.41 

6.64 

10.83 

2 

2.41 

3.22 

4.60 

5.99 

7.82 

9.21 

13.82 

3 

3.66 

4.64 

6.25 

7.82 

9.84 

11.34 

16.27 

4 

4.88 

5.99 

7.78 

9.49 

11.67 

13.28 

18.46 

5 

6.06 

7.29 

9.24 

11.07 

13.39 

15.09 

20.52 

6 

7.23 

8.56 

10.64 

12.59 

15.03 

16.81 

22.46 

7 

8.38 

9.80 

12.02 

14.07 

16.62 

18.48 

24.32 

8 

9.52 

11.03 

13.36 

15.51 

18.17 

20.09 

26.12 

9 

10.66 

12.24 

14.68 

16.92 

19.68 

21.67 

27.88 

10 

11.78 

13.44 

15.99 

18.31 

21.16 

23.21 

29.59 

11 

12.90 

14.63 

17.28 

19.68 

22.62 

24.72 

31.26 

12 

14.01 

15.81 

18.55 

21.03 

24.05 

26.22 

32.91 

13 

15.12 

16.98 

19.81 

22.36 

25.47 

27.69 

34.53 

14 

16.22 

18.15 

21.06 

23.68 

26.87 

29.14 

36.12 

15 

17.32 

19.31 

22.31 

25.00 

28.26 

30.58 

37.70 

16 

28.42 

20.46 

23.54 

26.30 

29.63 

32.00 

39.25 

17 

19.51 

21.62 

24.77 

27.59 

31.00 

33.41 

40.79 

18 

20.60 

22.76 

25.98 

28.87 

32.35 

34.80 

42.31 

19 

21.69 

23.90 

27.20 

30.14 

33.69 

36.19 

43.82 

20 

22.78 

25.04 

28.41 

31.41 

35.02 

37.57 

45.32 

21 

23.86 

26.17 

29.62 

32.67 

36.34 

38.93 

46.80 

22 

24.94 

27.30 

30.81 

33.92 

37.66 

40.29 

48.27 

23 

26.02 

28.43 

32.01 

35.17 

38.97 

41.64 

49.73 

24 

27.10 

29.55 

33.20 

36.42 

40.27 

42.98 

51.18 

25 

28.17 

30.68 

34.38 

37.65 

41.57 

44.31 

52.62 

26 

29.25 

31.80 

35.56 

38.88 

42.86 

45.64 

54.05 

27 

30.32 

32.91 

36.74 

40.11 

44.14 

46.96 

55.48 

28 

31.39 

34.03 

37.92 

41.34 

45.42 

48.28 

56.89 

29 

32.46 

35.14 

39.09 

42.56 

46.69 

49.59 

58.20 

30 

33.53 

36.25 

40.26 

43.77 

47.96 

50.69 

59.70 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LAV. TRANS ORMACI 


NDErAz(es e ir z = 0,5 Log e 


1 + r 
1 - 


r 

Z 


r 

z 


r 

z 

.00 

.000 


.36 

.377 


.71 

.887 

.01 

.010 


.37 

.388 


.72 

.908 

.02 

.020 


.38 

.400 


.73 

.929 

.03 

.030 


.39 

.412 


.74 

.950 

.04 

.040 


.40 

.424 


.75 

.973 

.05 

.050 







.06 

.060 


.41 

.436 


.76 

.996 

.07 

.070 


.42 

.448 


.77 

1.020 

.08 

.080 


.43 

.460 


.78 

1.045 

.09 

.090 


.44 

.472 


.79 

1.071 

.10 

.100 


.45 

.485 


.80 

1.099 

.11 

.110 


.46 

.497 


.81 

1.127 

.12 

.121 


.47 

.510 


.82 

1.157 

.13 

.131 


.48 

.523 


.83 

1.188 

.14 

.141 


.49 

.536 


.84 

1.221 

.15 

.151 


.50 

.549 


.85 

1.256 

.16 

.161 


.51 

.563 


.86 

1.293 

.17 

.172 


.52 

.576 


.87 

1.333 

.18 

.182 


.53 

.590 


.88 

1.376 

.19 

.192 


.54 

.604 


.89 

1.422 

.20 

.203 


.55 

.618 


.90 

1.472 

.21 

.213 


.56 

.633 


.91 

1.528 

.22 

.224 


.57 

.648 


.92 

1.589 

.23 

.234 


.58 

.662 


.93 

1.658 

.24 

.245 


.59 

.678 


.94 

1.738 

.25 

.255 


.60 

.693 


.95 

1.832 

.26 

.266 


.61 

.709 


.96 

1.946 

.27 

.277 


.62 

.725 


.97 

2.092 

.28 

.288 


.63 

.741 


.98 

2.298 

.29 

.299 


.64 

.758 


.99 

2.647 

.30 

.310 


.65 

.775 




.31 

.321 


.66 

.793 



.32 

.332 


.67 

.811 



.33 

.343 


.68 

.829 



.34 

.354 


.69 

.848 



.35 

.365 


.70 

.867 
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TA LAVI. NUMEROSALA AR 


15 

77 

01 

64 

69 

69 

58 

40 

81 

16 

60 

20 

00 

84 

22 

28 

26 

46 

66 

36 

86 

66 

17 

34 

49 

85 

40 

51 

40 

10 

15 

33 

94 

11 

65 

57 

62 

94 

04 

99 

05 

57 

22 

71 

77 

99 

68 

12 

11 

14 

47 

69 

35 

90 

95 

16 

17 

45 

86 

29 

15 

70 

48 

02 

00 

59 

33 

93 

28 

58 

34 

32 

24 

34 

07 

13 

26 

87 

40 

20 

40 

81 

46 

08 

09 

74 

99 

16 

92 

99 

85 

19 

01 

23 

11 

74 

00 

79 

41 

69 

10 

55 

33 

20 

47 

54 

16 

86 

11 

16 

59 

34 

71 

55 

84 

03 

48 

17 

60 

13 

38 

71 

23 

91 

83 

05 

06 

67 

26 

77 

14 

85 

40 

52 

68 

60 

41 

94 

98 

18 

62 

20 

94 

03 

71 

60 

26 

45 

17 

92 

65 

50 

89 

18 

74 

42 

07 

05 

15 

69 

86 

97 

40 

25 

88 

14 

17 

73 

92 

07 
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11 

93 

45 

25 

59 

68 

53 

31 

55 

73 

47 

16 

49 

79 

69 

80 

76 

16 

60 

58 

53 

07 

04 

53 

66 

94 

94 

18 

13 

31 

31 

05 

36 

48 

75 

16 

00 

21 

11 

42 

44 

84 

46 

84 

83 

20 

49 

17 

12 

21 

93 

34 

61 

16 

91 

59 

46 

44 

45 

49 

25 

36 

12 

07 

25 

90 

89 

55 

25 

83 

47 

17 

23 

93 

99 

56 

14 

39 

16 

63 

59 

73 

21 

67 

80 

00 

25 

58 

25 

72 

06 

12 

86 

74 

54 

79 

70 

85 

88 

71 

58 

21 

98 

48 

89 

72 

47 

46 

94 

78 

56 

10 

65 

97 

84 

79 

42 

31 

49 

94 

15 

31 

13 

09 

45 

43 

03 

82 

81 

70 

51 

21 

03 

18 

50 

21 

99 

49 

73 

06 

99 

19 

24 

96 

39 

43 

10 

14 

12 

94 

08 

55 

54 

70 

14 

15 

99 

60 

44 

62 

72 

38 

18 

36 

63 

92 

61 

55 

93 

77 

66 

82 

10 

91 

81 

51 

67 

01 

47 

92 

46 

90 

39 

99 

64 

08 

00 

97 

27 

54 

96 

63 

40 

54 

34 

70 

27 

48 

18 

68 

59 

91 

83 

32 

81 

23 

17 

13 

01 

37 

57 

92 

16 

34 

15 

80 

90 

25 

64 

67 

77 

29 

95 

84 

80 

84 

84 

87 

22 

87 

54 

42 

46 

56 
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89 
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06 

98 

59 

90 

74 
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83 
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13 
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48 

25 

33 
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08 
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60 
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88 
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89 
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83 

16 

94 

55 

14 

00 

97 

32 

51 

92 

47 
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92 

33 

73 

20 

21 

29 

77 

37 

06 

98 

64 

63 

34 

31 

43 

69 

21 

94 

26 

20 

73 

90 

70 

92 

76 

49 

14 

60 

34 

43 

90 

51 
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88 

55 

33 

69 

0 

87 

79 

94 

46 

17 

61 

72 

27 

01 

37 

63 

35 

93 

23 

17 

30 

14 

51 

51 

17 

28 

21 

74 

67 

2 

11 

57 

19 

27 

38 

70 

73 

82 

92 

39 

22 

96 

00 

48 

52 

49 

62 

09 

40 

08 

30 

27 

54 

70 

6 

06 

52 

12 

80 

36 

12 

38 

68 

05 

61 

29 

84 

34 

51 

60 

19 

77 

82 

16 

64 

45 

02 

27 

04 

5 

55 

90 

95 

04 

20 

39 

29 

96 

28 

38 

84 

18 

10 

29 

10 

09 

66 

06 

78 

37 

09 

60 

50 

21 

2 

72 

01 

52 

70 

29 

65 

05 

37 

16 

64 

29 

48 

04 

08 

55 

72 

25 

25 

77 

54 

26 

27 

24 

39 

6 

67 

06 

40 

00 

99 

35 

70 

69 

58 

64 

02 

32 

99 

63 

62 

42 

89 

32 

20 

81 

14 

08 

40 

45 

2 

15 

37 

49 

38 

96 

51 

19 

08 

27 

13 

83 

39 

51 

30 

31 

49 

94 

83 

66 

02 

50 

95 

18 

98 

8 

84 

90 

58 

81 

00 

40 

91 

12 

46 

83 

30 

90 

09 

35 

41 

12 

87 

93 

66 

85 

96 

20 

65 

34 

3 

13 

05 

41 

01 

91 

48 

95 

59 

45 

46 

63 

53 

97 

63 

18 

86 

37 

56 

20 

35 

62 

66 

11 

37 

0 

91 

89 

97 

51 

64 

78 

06 

95 

65 

54 

43 

40 

02 

41 

55 

70 

52 

96 

87 

02 

82 

61 

21 

88 

0 

65 

98 

42 

09 

03 

61 

20 

83 

01 

27 

18 

65 

62 

01 

97 

45 

79 

51 

37 

74 

47 

20 

11 

48 

7 

93 

73 

86 

50 

46 

61 

95 

01 

24 

45 

42 

16 

13 

20 

34 

51 

08 

71 

52 

39 

17 

71 

39 

84 

7 

27 

72 

49 

42 

81 

62 

32 

87 

22 

35 

92 

97 

02 

34 

93 

32 

95 

81 

13 

92 

05 

40 

70 

95 

1 

66 

61 

24 

08 

77 

32 

73 

66 

79 

60 

55 

35 

57 

24 

52 

95 

84 

90 

64 

38 

39 

72 

70 

17 

8 

42 

85 

96 

67 

41 

11 

83 

17 

78 

43 

17 

21 

09 

60 

58 

86 

12 

31 

11 

66 

61 

43 

96 

00 

3 

97 

00 

15 

20 

37 

96 

73 

56 

63 

07 

85 

74 

58 

28 

38 

74 

68 

32 

61 

87 

14 

71 

83 

47 

0 

11 

96 

70 

08 

67 

04 

34 

46 

08 

33 

00 

29 

08 

87 

42 

59 

40 

24 

97 

44 

99 

13 

56 

87 

5 

02 

47 

97 

89 

23 

51 

45 

37 

83 

97 

14 

00 

42 

23 

72 

03 

19 

02 

41 

11 

23 

36 

98 

32 

9 

91 

42 

03 

58 

62 

23 

74 

45 

06 

68 

58 

32 

80 

82 

40 

49 

71 

83 

37 

93 

49 

99 

69 

72 

8 

14 

26 

88 

95 

48 

69 

35 

40 

63 

39 

87 

38 

16 

06 

82 

92 

62 

32 

75 

67 

64 

50 

49 

39 

9 

55 

53 

92 

97 

04 

48 

60 

53 

90 

37 

73 

01 

84 

87 

42 

88 

30 

93 

75 

01 

18 

34 

73 

30 

8 

44 

28 

18 

01 

00 

38 

26 

38 

57 

15 

62 

38 

72 

92 

03 

76 

09 

30 

75 

77 

80 

04 

24 

54 

67 

60 

1 

79 

26 

21 

60 

03 

48 

14 

77 

81 

15 

14 

67 

55 

24 

22 

20 

55 

36 

93 

67 

69 

37 

72 

22 

4 

46 

32 

56 

15 

75 

25 

12 

18 

87 

05 

09 

96 

45 

14 

72 

41 

46 

12 

67 

46 

72 

02 

59 

06 

1 

49 

12 

73 

28 

23 

52 

48 

08 

58 

53 

63 

66 

13 

07 

04 

48 

71 

39 

07 

46 

96 

40 

20 

86 

7 

11 

81 

74 

11 

15 

23 

17 

16 

07 

79 

57 

61 

42 

19 

68 

15 

12 

60 

21 

59 

12 

07 

04 

99 

8 

22 

39 

75 

16 

69 

13 

84 




GLOSARIO 


837 


TA LA VII. DISTRI UCI N DE POISSON 
(0 < A. < 1) 


\ 

0 

i 

2 



5 

6 




0,0 

1,0000 

0,9900 

0,9802 

0,9704 

0,9608 

0,9512 

0,9418 

0,9324 

0,9231 

0,9139 

0,1 

0,9048 

0,8958 

0,8869 

0,8781 

0,8694 

0,8607 

0,8521 

0,8437 

0,8353 

0,8270 

0,2 

0,8187 

0,8106 

0,8025 

0,7945 

0,7866 

0,7788 

0,7711 

0,7634 

0,7558 

0,7483 

0,3 

0,7408 

0,7334 

0,7261 

0,7189 

0,7118 

0,7047 

0,6977 

0,6907 

0,6839 

0,6771 

0,4 

0,6703 

0,6636 

0,6570 

0,6505 

0,6440 

0,6376 

0,6313 

0,6250 

0,6188 

0,6126 

0,5 

0,6065 

0,6005 

0,5945 

0,5886 

0,5827 

0,5770 

0,5712 

0,5655 

0,5599 

0,5543 

0,6 

0,5488 

0,5434 

0,5379 

0,5326 

0,5273 

0,5220 

0,5169 

0,5117 

0,5066 

0,5016 

0,7 

0,4966 

0,4916 

0,4868 

0,4819 

0,4771 

0,4724 

0,4677 

0,4630 

0,4584 

0,4538 

0,8 

0,4493 

0,4449 

0,4404 

0,4360 

0,4317 

0,4274 

0,4232 

0,4190 

0,4148 

0,4107 

0,9 

0,4066 

0,4025 

0,3985 

0,3946 

0,3906 

0,3867 

0,3829 

0,3791 

0,3753 

0,3716 


= 1 2 . 10 ) 


\ 

i 

2 



5 

6 




10 

e~ x 

0,36788 

0,13534 

0,04979 

0,01832 

0,006738 

0,002479 

0,000912 

0,000335 

0,000123 

0,000045 


Nota: Para obtener los valores de e k para otros valores de emplear las leyes de los exponentes. 


Ejemplo: e ~ 3 ' 48 = (e- 3 - 00 ) (<r 0 - 48 ) = (0,04979) (0,6188) = 0,03081 





























ESTADISTICAY MUESTREO 


TA LAVIII. INTERVALO DE CON IAN ADEL 5 (2SIGMA) 


L mites 

e error 

± 2 oen 

d 

VALORES PRESUMI LESDE P{ + =100) 

OOl 

002 

OlO 

015 

020 

025 

O O 

O 5 

O O 

O 5 

0,1 .... 

39.600 

78.400 

360.000 

510.000 

640.000 

750.000 

840.000 

910.000 

960.000 

1 . 000.000 

0,2 .... 

9.900 

19.600 

90.000 

127.500 

160.000 

187.500 

210.000 

227.500 

240.000 

250.000 

0,3 .... 

4.400 

8.711 

40.000 

56.667 

71.111 

83.333 

93.333 

101.111 

106.667 

111.111 

0,4 .... 

2.475 

4.900 

22.500 

31.875 

40.000 

46.875 

52.500 

56.875 

60.000 

62.500 

0,5 .... 

1.584 

3.136 

14.400 

20.400 

25.600 

30.000 

33.600 

36.400 

38.400 

40.000 

0,6 .... 

1.100 

2.178 

10.000 

14.167 

17.778 

20.833 

23.333 

25.278 

26.667 

27.778 

0,7 .... 

808 

1.600 

7.347 

14.408 

13.061 

15.306 

17.143 

18.577 

19.592 

20.408 

0,8 .... 

619 

1.225 

5.625 

7.969 

10.000 

11.719 

13.125 

14.219 

15.000 

15.625 

0,9 .... 

489 

968 

4.444 

6.901 

7.901 

9.259 

10.370 

11.235 

11.852 

12.346 

1,0.... 

396 

784 

3.600 

5.100 

6.400 

7.500 

8.400 

9.100 

9.600 

10.000 

1,5 .... 

176 

348 

1.600 

2.267 

2.844 

3.333 

3.733 

4.044 

4.267 

4.444 

2,0.... 

99 

196 

900 

1.275 

1.600 

1.875 

2.100 

2.275 

2.400 

2.500 

2,5 .... 

63 

125 

576 

816 

1.024 

1.200 

1.344 

1.456 

1.536 

1.600 

3,0.... 

44 

87 

400 

567 

711 

833 

933 

1.011 

1.067 

1.111 

3,5 .... 

32 

64 

294 

416 

522 

612 

686 

743 

784 

816 

4,0.... 

25 

49 

225 

319 

400 

469 

525 

569 

600 

625 

4,5 .... 

20 

39 

178 

252 

316 

370 

415 

449 

474 

494 

5,0.... 

16 

31 

144 

204 

256 

300 

336 

364 

384 

400 

6,0.... 

11 

22 

100 

142 

178 

208 

233 

253 

267 

278 

7,0.... 

8 

16 

73 

104 

131 

153 

171 

186 

196 

204 

8,0.... 

6 

12 

56 

80 

100 

117 

131 

142 

150 

156 

9,0.... 

5 

10 

44 

63 

79 

93 

104 

112 

119 

123 

10,0.... 

4 

8 

36 

51 

64 

75 

83 

91 

96 

100 

15,0.... 

2 

3 

16 

23 

28 

33 

37 

40 

43 

45 

20,0 .... 

1 

2 

9 

13 

16 

19 

21 

23 

24 

25 

25,0 .... 

0,6 

1 

6 

8 

12 

12 

13 

15 

15 

16 


00 

m 

00 











































TA LAI . SEGURIDAD DEL 5 (2SIGMA) 



00 

U» 

VO 


GL0SARI0 
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TA LA . SEGURIDAD DEL 


( SIGMA) 



O 

00 
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TA LA I.Enla etermina i n euna muestra (n) sacada de una poblacion Anita, 
para m rgenes eerror el 2 5 10 en la ip tesis e = 50 

Margen de confianza del 95% 


Amplitu 

ela 

pobla i n 

N 

Amplitu e la muestra para m 

rgenes e error abajo in i a 

OS 

±1 

±2 

± 

± 

±5 

±10 

500 ... 





222 

83 

1.000 ... 




485 

286 

91 

1.500 ... 



638 

441 

316 

94 

2.000 ... 



714 

476 

333 

95 

2.500 . . . 


1.250 

769 

500 

345 

96 

3.000 ... 


1.364 

811 

517 

353 

97 

3.500 ... 


1.458 

843 

530 

359 

97 

4.000 ... 


1.538 

870 

541 

364 

98 

4.500 . . . 


1.607 

891 

549 

367 

98 

5.000 ... 


1.667 

909 

556 

370 

98 

6.000 ... 


1.765 

938 

566 

375 

98 

7.000 ... 


1.842 

949 

574 

378 

99 

8.000 ... 


1.905 

976 

580 

381 

99 

9.000 ... 


1.957 

989 

584 

383 

99 

10.000 . . . 

5.000 

2.000 

1.000 

588 

385 

99 

15.000 ... 

6.000 

2.143 

1.034 

600 

390 

99 

20.000 . . . 

6.667 

2.222 

1.059 

606 

392 

100 

25.000 . . . 

7.143 

2.273 

1.064 

610 

394 

100 

50.000 ... 

8.333 

2.381 

1.087 

617 

397 

100 

100.000 ... 

10.000 

2.500 

1.111 

625 

400 

100 

















842 


CIRO MARTINEZ BENCARDINO 
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TA LA II. Enla 
para m rgenes 


etermina i n 
eerror el 


e una muestra («) sacada de una poblacion Anita, 
2 5 en la ip tesis e =50 


Margen de conAanza del 99,7% 


Amplitu 

ela 

pobla i n 

N 

Amplitu e la muestra para m rgenes 

e error abajo in i 

i a os 

±1 

±2 

± 

± 

±5 

500 . 






1.000 . 





474 

1.500 . 




726 

563 

2.000 . 




826 

621 

2.500 . 




900 

662 

3.000 . 



1.364 

958 

692 

3.500 . 



1.458 

1.003 

716 

4.000 . 



1.539 

1.041 

735 

4.500 . 



1.607 

1.071 

750 

5.000 . 



1.667 

1.098 

763 

6.000 . 


2.903 

1.765 

1.139 

783 

7.000 . 


3.119 

1.842 

1.171 

798 

8.000 . 


3.303 

1.905 

1.196 

809 

9.000 . 


3.462 

1.957 

1.216 

818 

10.000 . 


3.600 

2.000 

1.233 

826 

15.000 . 


4.091 

2.143 

1.286 

849 

20.000 . 


4.390 

2.222 

1.314 

861 

25.000 . 

11.842 

4.592 

2.273 

1.331 

869 

50.000 . 

15.517 

5.056 

2.381 

1.368 

884 

100.000 . 

22.500 

5.625 

2.500 

1.406 

900 
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TA LA III. Probabili a esaso ia as on alorestanpe ue os omolos aloresobser a os 

e U en la prueba e M ann itney 


u 

1 

2 


0 

.250 

.100 

.050 

1 

.500 

.200 

.100 

2 

.750 

.400 

.200 

3 


.600 

.350 

4 



.500 

5 



.650 














n 2 = 5 


u \ 

i 

2 



5 

0 

.167 

.047 

.018 

.008 

.004 

1 

.333 

.095 

.036 

.016 

.008 

2 

.500 

.190 

.071 

.032 

.016 

3 

.667 

.286 

.125 

.056 

.028 

4 


.429 

.196 

.095 

.048 

5 


.571 

.286 

.143 

.075 

6 



.393 

.206 

.111 

7 



.500 

.278 

.155 

8 



.607 

. 65 

.210 

9 




.452 

.274 

10 




.548 

.345 

11 





.421 

12 





.500 

13 





.579 
































u. . . 

1 

2 



0 

.200 

.067 

.028 

.014 

1 

.400 

.133 

.057 

.029 

2 

.600 

.267 

.144 

.057 

3 


.400 

.200 

.100 

4 


.600 

.314 

.171 

5 



.429 

.243 

6 



.571 

.343 

7 




.443 

8 




.557 


n 2 = 6 


u \ 

i 

2 



5 

6 

0 

.143 

.036 

.012 

.005 

.002 

.001 

1 

.286 

.071 

.024 

.010 

.004 

.002 

2 

.428 

.143 

.048 

.019 

.009 

.004 

3 

.571 

.214 

.083 

.033 

.015 

.008 

4 


.321 

.131 

.057 

.026 

.013 

5 


.429 

.190 

.086 

.041 

.021 

6 


.571 

.274 

.129 

.063 

.032 

7 



.357 

.176 

.089 

.047 

8 



.452 

.238 

.123 

.066 

9 



.548 

.305 

.165 

.090 

10 




.381 

.214 

.120 

11 




.457 

.268 

.155 

12 




.545 

.331 

.197 

13 





.396 

.242 

14 





.465 

.294 

15 





.535 

.350 

16 






.409 

17 






.469 

18 






.531 
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Reproducida de Mann, H.B. y Whitney, D.R. 1947. En una prueba de si una o dos variables aleatorias es estocasticamente 
mayor que la otra. 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA III. Probabili a esaso ia as on alorestanpe ue os omolos aloresobser a os 
e U en la prueba e M ann itney ( ontinua i n) 


^\ n l 

u \ 

i 

2 



5 

6 


0 

.125 

.028 

.008 

.003 

.001 

.001 

.000 

1 

.250 

.056 

.017 

.006 

.003 

.001 

.001 

2 

.375 

.111 

.033 

.012 

.005 

.002 

.001 

3 

.500 

.167 

.058 

.021 

.009 

.004 

.002 

4 

.625 

.250 

.092 

.036 

.015 

.007 

.003 

5 


.333 

.133 

.055 

.024 

.011 

.006 

6 


.444 

.192 

.082 

.037 

.017 

.009 

7 


.556 

.258 

.115 

.053 

.026 

.013 

8 



.333 

.158 

.074 

.037 

.019 

9 



.417 

.206 

.101 

.051 

.027 

10 



.500 

.264 

.134 

.069 

.036 

11 



.583 

.324 

.172 

.090 

.049 

12 




.394 

.216 

.117 

.064 

13 




.464 

.265 

.147 

.082 

14 




.538 

.319 

.183 

.104 

15 





.378 

.223 

.130 

16 





.438 

.267 

.159 

17 





.500 

.314 

.191 

18 





.562 

.365 

.228 

19 






.418 

.267 

20 






.473 

.310 

21 






.527 

.355 

22 







.402 

23 







.451 

24 







.500 

25 







.549 


Reproducida de Mann, H.B. y Whitney, D.R. 1947. En una prueba de si una o dos variables aleatorias es estocasticamente 
mayor que la otra. 
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TA LA III. Probabili a esaso ia as on alorestanpe ue os omolos aloresobser a os 
e U en la prueba e M ann itney ( ontinua i n) 


«2 = 


\»1 

u \ 

1 

2 



5 

6 



t 

Normal 

0 

.111 

.022 

.006 

.002 

.001 

.000 

.000 

.000 

3,308 

.001 

1 

.222 

.044 

.012 

.004 

.002 

.001 

.000 

.000 

3,203 

.001 

2 

.333 

.089 

.024 

.008 

.003 

.001 

.001 

.000 

3,098 

.001 

3 

.444 

.133 

.042 

.014 

.005 

.002 

.001 

.001 

2,993 

.001 

4 

.556 

.200 

.067 

.024 

.009 

.004 

.002 

.001 

2,888 

.002 

5 


.267 

.097 

.036 

.015 

.006 

.003 

.001 

2,783 

.003 

6 


.356 

.139 

.055 

.023 

.010 

.005 

.002 

2,678 

.004 

7 


.444 

.188 

.077 

.033 

.015 

.007 

.003 

2,573 

.005 

8 


.556 

.248 

.107 

.047 

.021 

.010 

.005 

2,468 

.007 

9 



.315 

.141 

.064 

.030 

.014 

.007 

2,363 

.009 

10 



.387 

.184 

.085 

.041 

.020 

.010 

2,258 

.012 

11 



.461 

.230 

.111 

.054 

.027 

.014 

2,153 

.016 

12 



.539 

.285 

.142 

.071 

.036 

.019 

2,048 

.020 

13 




.341 

.177 

.091 

.047 

.025 

1,943 

.026 

14 




.404 

.217 

.114 

.060 

.032 

1,838 

.033 

15 




.467 

.262 

.141 

.076 

.041 

1,733 

.041 

16 




.533 

.311 

.172 

.095 

.052 

1,628 

.052 

17 





.362 

.207 

.116 

.065 

1,523 

.064 

18 





.416 

.245 

.140 

.080 

1,418 
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Reproducida de Mann, H.B. y Whitney, D.R. 1947. En una prueba de si una o dos variables aleatorias es estocasticamente 
mayor que la otra. 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA IV. Valores r ti os ellenlaprueba eMann itney. 
Valores r ti os e U para una prueba e una ola en a = 0 001 
o para una prueba e os olas en a = 0 002. 
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Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para la estadlstica de Mann Whitney, 
Bulletin of the Institute of Educational Research at Indiana University. 
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TA LA IV. Valores r ti os ellenlaprueba eMann itney. 
Valores r ti os e U para una prueba e una ola en a = 0 01 
o para una prueba e os olas en <* = 0 02. (C ontinua i n) 
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Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para la estadistica de Mann Whitney, 
Bulletin of the Institute of Educational Research at Indiana University. 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA IV. Valores r ti os eUenlaprueba eMann itney. 
Valores r ti os e U para una prueba e una ola en a = 0 025 
o para una prueba e os olas en a = 0 05. (C ontinua i n) 
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Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para la estadlstica de Mann Whitney, 
Bulletin of the Institute of Educational Research at Indiana University. 
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TA LA IV. Valores r ti os eUenlaprueba eMann itney. 
Valores r ti os e U para una prueba e una ola en a = 0 05 
o para una prueba e os olasen a = 010. (Continua i n) 
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Tomada abreviadamente de las tablas 1, 3, 5 y 7 de Auble, D. 1953. Tablas extendidas para la estadlstica de Mann Whitney, 
Bulletin of the Institute of Educational Research at Indiana University. 
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TA LA V. PERCEINTTILLAS DE LAS DISTRI UCI ONES (A 2 i.) 
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160 

.673 

.690 

.736 

.758 

.793 

.824 

.860 

.905 

.939 

.968 

.996 

1.02 

1.06 

1.09 

1.15 

1.19 

1.23 

1.28 

1.31 

1.38 

1.41 

160 

180 

.689 

.706 

.749 

.771 

.804 

.833 

.868 

.910 

.942 

.970 

.996 

1.02 

1.05 

1.09 

1.14 

1.18 

1.22 

1.26 

1.29 

1.36 

1.38 

180 

200 

.703 

.719 

.761 

.782 

.814 

.841 

.874 

.915 

.945 

.972 

.997 

1.02 

1.05 

1.08 

1.13 

1.17 

1.21 

1.25 

1.28 

1.34 

1.36 

200 

250 

.732 

.746 

.785 

.804 

.832 

.858 

.887 

.924 

.951 

.975 

.997 

1.02 

1.04 

1.07 

1.12 

1.15 

1.18 

1.22 

1.25 

1.30 

1.32 

250 

300 

.753 

.767 

.802 

.820 

.846 

.870 

.897 

.931 

.956 

.977 

.998 

1.02 

1.04 

1.07 

1.11 

1.14 

1.17 

1.20 

1.22 

1.27 

1.29 

300 

350 

.770 

.783 

.816 

.833 

.857 

.879 

.904 

.936 

.959 

.979 

.998 

1.02 

1.04 

1.06 

1.10 

1.13 

1.15 

1.18 

1.21 

1.25 

1.27 

350 

400 

.784 

.796 

.827 

.843 

.866 

.887 

.911 

.940 

.962 

.981 

.998 

1.02 

1.04 

1.06 

1.09 

1.12 

1.14 

1.17 

1.19 

1.24 

1.25 

400 

450 

.795 

.807 

.837 

.852 

.874 

.893 

.916 

.944 

.964 

.982 

.999 

1.02 

1.03 

1.06 

1.09 

1.11 

1.13 

1.16 

1.18 

1.22 

1.23 

450 

500 

.805 

.816 

.845 

.859 

.880 

.898 

.920 

.946 

.966 

.983 

.999 

1.01 

1.03 

1.05 

1.08 

1.11 

1.13 

1.15 

1.17 

1.21 

1.22 

500 

750 

. 839 

.848 

.872 

.884 

.901 

.917 

.934 

.956 

.972 

.986 

.999 

1.01 

1.03 

1.04 

1.07 

1.09 

1.10 

1.12 

1.14 

1.17 

1.18 

750 

1000 

.859 

.868 

.889 

.899 

.914 

.928 

.943 

.962 

.976 

.988 

.999 

1.01 

1.02 

1.04 

1.06 

1.07 

1.09 

1.11 

1.12 

1.14 

1.15 

1000 

5000 

oc 

.936 

1 

.939 

1 

.949 

1 

.954 

1 

.961 

1 

.967 

1 

.974 

1 

.983 

1 

.989 

1 

.995 

1 

1.00 

1 

1.00 

1 

1.01 

1 

1.02 

1 

1.02 

1 

1.03 

1 

1.04 

1 

1.05 

1 

1.05 

1 

1.06 

1 

1.07 

1 

5000 

OC 


O 

m 

oo 




































GLOSARIO 


TA LA VI. DISTRI UCI N 



2 

! = gra os eliberta el numera or 

1 

2 



5 

6 




10 

1 

39,86 

49,50 

53,59 

55,83 

57,24 

58,20 

58,91 

59,44 

59,86 

60,19 

2 

8,53 

9,00 

9,16 

9,24 

9,29 

9,33 

9,35 

9,37 

9,38 

9,39 

3 

5,54 

5,46 

5,39 

5,34 

5,31 

5,28 

5,27 

5,25 

5,24 

5,23 

4 

4,54 

4,32 

4,19 

4,11 

4,05 

4,01 

3,98 

3,95 

3,94 

3,92 

5 

4,06 

3,78 

3,62 

3,52 

3,45 

3,40 

3,37 

3,34 

3,32 

3,30 

6 

3,78 

3,46 

3,29 

3,18 

3,11 

3,05 

3,01 

2,98 

2,96 

2,94 

7 

3,59 

3,26 

3,07 

2,96 

2,88 

2,83 

2,79 

2,75 

2,72 

2,70 

8 

3,46 

3,11 

2,92 

2,81 

2,73 

2,67 

2,62 

2,59 

2,56 

2,54 

9 

3,36 

3,01 

2,81 

2,69 

2,61 

2,55 

2,51 

2,47 

2,44 

2,42 

10 

3,29 

2,92 

2,73 

2,61 

2,52 

2,46 

2,41 

2,38 

2,35 

2,32 

11 

3,23 

2,86 

2,66 

2,54 

2,45 

2,39 

2,34 

2,30 

2,27 

2,25 

12 

3,18 

2,81 

2,61 

2,48 

2,39 

2,33 

2,28 

2,24 

2,21 

2,19 

13 

3,14 

2,76 

2,56 

2,43 

2,35 

2,28 

2,23 

2,20 

2,16 

2,14 

14 

3,10 

2,73 

2,52 

2,39 

2,31 

2,24 

2,19 

2,15 

2,12 

2,10 

15 

3,07 

2,70 

2,49 

2,36 

2,27 

2,21 

2,16 

2,12 

2,09 

2,06 

16 

3,05 

2,67 

2,46 

2,33 

2,24 

2,18 

2,13 

2,09 

2,06 

2,03 

17 

3,03 

2,64 

2,44 

2,31 

2,22 

2,15 

2,10 

2,06 

2,03 

2,00 

18 

3,01 

2,62 

2,42 

2,29 

2,20 

2,13 

2,08 

2,04 

2,00 

1,98 

19 

2,99 

2,61 

2,40 

2,27 

2,18 

2,11 

2,06 

2,02 

1,98 

1,96 

20 

2,97 

2,59 

2,38 

2,25 

2,16 

2,09 

2,04 

2,00 

1,96 

1,94 

21 

2,96 

2,57 

2,36 

2,23 

2,14 

2,08 

2,02 

1,98 

1,95 

1,92 

22 

2,95 

2,56 

2,35 

2,22 

2,13 

2,06 

2,01 

1,97 

1,93 

1,90 

23 

2,94 

2,55 

2,34 

2,21 

2,11 

2,05 

1,99 

1,95 

1,92 

1,89 

24 

2,93 

2,54 

2,33 

2,19 

2,10 

2,04 

1,98 

1,94 

1,91 

1,88 

25 

2,92 

2,53 

2,32 

2,18 

2,09 

2,02 

1,97 

1,93 

1,89 

1,87 

26 

2,91 

2,52 

2,31 

2,17 

2,08 

2,01 

1,96 

1,92 

1,88 

1,86 

27 

2,90 

2,51 

2,30 

2,17 

2,07 

2,00 

1,95 

1,91 

1,87 

1,85 

28 

2,89 

2,50 

2,29 

2,16 

2,06 

2,00 

1,94 

1,90 

1,87 

1,84 

29 

2,89 

2,50 

2,28 

2,15 

2,06 

1,99 

1,93 

1,89 

1,86 

1,83 

30 

2,88 

2,49 

2,28 

2,14 

2,05 

1,98 

1,93 

1,88 

1,85 

1,82 

35 

2,85 

2,46 

2,25 

2,11 

2,02 

1,95 

1,90 

1,85 

1,82 

1,79 

40 

2,84 

2,44 

2,23 

2,09 

2,00 

1,93 

1,87 

1,83 

1,79 

1,76 

50 

2,81 

2,41 

2,20 

2,06 

1,97 

1,90 

1,84 

1,80 

1,76 

1,73 

60 

2,79 

2,39 

2,18 

2,04 

1,95 

1,87 

1,82 

1,77 

1,74 

1,71 

80 

2,77 

2,37 

2,15 

2,02 

1,92 

1,85 

1,79 

1,75 

1,71 

1,68 

100 

2,76 

2,36 

2,14 

2,00 

1,91 

1,83 

1,78 

1,73 

1,69 

1,66 

200 

2,73 

2,33 

2,11 

1,97 

1,88 

1,80 

1,75 

1,70 

1,66 

1,63 

500 

2,72 

2,31 

2,09 

1,96 

1,86 

1,79 

1,73 

1,68 

1,64 

1,61 

1000 

2,71 

2,31 

2,09 

1,95 

1,85 

1,78 

1,72 

1,68 

1,64 

1,61 


851 


Nota El valor de a corresponde a probabilidades unilaterales. 
























































852 


CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA VI. DISTRI UCI N 
a = 010 
(Continua i n) 


2 

j = gra os eliberta el numera or 

11 

12 

15 

20 

25 

0 

0 

50 

100 

1000 

1 

60,47 

60,71 

61,22 

61,74 

62,06 

62,26 

62,53 

62,69 

63,00 

63,29 

2 

9,40 

9,41 

9,42 

9,44 

9,45 

9,46 

9,47 

9,47 

9,48 

9,49 

3 

5,22 

5,22 

5,20 

5,19 

5,17 

5,17 

5,16 

5,15 

5,14 

5,13 

4 

3,91 

3,90 

3,87 

3,84 

3,83 

3,82 

3,80 

3,80 

3,78 

3,76 

5 

3,28 

3,27 

3,24 

3,21 

3,19 

3,17 

3,16 

3,15 

3,13 

3,11 

6 

2,92 

2,90 

2,87 

2,84 

2,81 

2,80 

2,78 

2,77 

2,75 

2,72 

7 

2,68 

2,67 

2,63 

2,59 

2,57 

2,56 

2,54 

2,52 

2,50 

2,47 

8 

2,52 

2,50 

2,46 

2,42 

2,40 

2,38 

2,36 

2,35 

2,32 

2,30 

9 

2,40 

2,38 

2,34 

2,30 

2,27 

2,25 

2,23 

2,22 

2,19 

2,16 

10 

2,30 

2,28 

2,24 

2,20 

2,17 

2,16 

2,13 

2,12 

2,09 

2,06 

11 

2,23 

2,21 

2,17 

2,12 

2,10 

2,08 

2,05 

2,04 

2,00 

1,98 

12 

2,17 

2,15 

2,10 

2,06 

2,03 

2,01 

1,99 

1,97 

1,94 

1,91 

13 

2,12 

2,10 

2,05 

2,01 

1,98 

1,96 

1,93 

1,92 

1,88 

1,85 

14 

2,07 

2,05 

2,01 

1,96 

1,93 

1,91 

1,89 

1,87 

1,83 

1,80 

15 

2,04 

2,02 

1,97 

1,92 

1,89 

1,87 

1,85 

1,83 

1,79 

1,76 

16 

2,01 

1,99 

1,94 

1,89 

1,86 

1,84 

1,81 

1,79 

1,76 

1,72 

17 

1,98 

1,96 

1,91 

1,86 

1,83 

1,81 

1,78 

1,76 

1,73 

1,69 

18 

1,95 

1,93 

1,89 

1,84 

1,80 

1,78 

1,75 

1,74 

1,70 

1,66 

19 

1,93 

1,91 

1,86 

1,81 

1,78 

1,76 

1,73 

1,71 

1,67 

1,64 

20 

1,91 

1,89 

1,84 

1,79 

1,76 

1,74 

1,71 

1,69 

1,65 

1,61 

21 

1,90 

1,87 

1,83 

1,78 

1,74 

1,72 

1,69 

1,67 

1,63 

1,59 

22 

1,88 

1,86 

1,81 

1,76 

1,73 

1,70 

1,67 

1,65 

1,61 

1,57 

23 

1,87 

1,84 

1,80 

1,74 

1,71 

1,69 

1,66 

1,64 

1,59 

1,55 

24 

1,85 

1,83 

1,78 

1,73 

1,70 

1,67 

1,64 

1,62 

1,58 

1,54 

25 

1,84 

1,82 

1,77 

1,72 

1,68 

1,66 

1,63 

1,61 

1,56 

1,52 

26 

1,83 

1,81 

1,76 

1,71 

1,67 

1,65 

1,61 

1,59 

1,55 

1,51 

27 

1,82 

1,80 

1,75 

1,70 

1,66 

1,64 

1,60 

1,58 

1,54 

1,50 

28 

1,81 

1,79 

1,74 

1,69 

1,65 

1,63 

1,59 

1,57 

1,53 

1,48 

29 

1,80 

1,78 

1,73 

1,68 

1,64 

1,62 

1,58 

1,56 

1,52 

1,47 

30 

1,79 

1,77 

1,72 

1,67 

1,63 

1,61 

1,57 

1,55 

1,51 

1,46 

35 

1,76 

1,74 

1,69 

1,63 

1,60 

1,57 

1,53 

1,51 

1,47 

1,42 

40 

1,74 

1,71 

1,66 

1,61 

1,57 

1,54 

1,51 

1,48 

1,43 

1,38 

50 

1,70 

1,68 

1,63 

1,57 

1,53 

1,50 

1,46 

1,44 

1,39 

1,33 

60 

1,68 

1,66 

1,60 

1,54 

1,50 

1,48 

1,44 

1,41 

1,36 

1,30 

80 

1,65 

1,63 

1,57 

1,51 

1,47 

1,44 

1,40 

1,38 

1,32 

1,25 

100 

1,64 

1,61 

1,56 

1,49 

1,45 

1,42 

1,38 

1,35 

1,29 

1,22 

200 

1,60 

1,58 

1,52 

1,46 

1,41 

1,38 

1,34 

1,31 

1,24 

1,16 

500 

1,58 

1,56 

1,50 

1,44 

1,39 

1,36 

1,31 

1,28 

1,21 

1,11 

1000 

1,58 

1,55 

1,49 

1,43 

1,38 

1,35 

1,30 

1,27 

1,20 

1,08 






















































GLOSARIO 


853 


TA LA VI. DISTRI UCI N 
a = 005 
(Continua i n) 


2 

1 = gra os eliberta el numera or 

1 

2 



5 

6 




10 

1 

161,45 

199,50 

215,71 

224,58 

230,16 

233,99 

236,77 

238,88 

240,54 

241,88 

2 

18,51 

19,00 

19,16 

19,25 

19,30 

19,33 

19,35 

19,37 

19,38 

19,40 

3 

10,13 

9,55 

9,28 

9,12 

9,01 

8,94 

8,89 

8,85 

8,81 

8,79 

4 

7,71 

6,94 

6,59 

6,39 

6,26 

6,16 

6,09 

6,04 

6,00 

5,97 

5 

6,61 

5,79 

5,41 

5,19 

5,05 

4,95 

4,88 

4,82 

4,77 

4,73 

6 

5,99 

5,14 

4,76 

4,53 

4,39 

4,28 

4,21 

4,15 

4,10 

4,06 

7 

5,59 

4,74 

4,35 

4,12 

3,97 

3,87 

3,79 

3,73 

3,68 

3,64 

8 

5,32 

4,46 

4,07 

3,84 

3,69 

3,58 

3,50 

3,44 

3,39 

3,35 

9 

5,12 

4,26 

3,86 

3,63 

3,48 

3,37 

3,29 

3,23 

3,18 

3,14 

10 

4,96 

4,10 

3,71 

3,48 

3,33 

3,22 

3,14 

3,07 

3,02 

2,98 

11 

4,84 

3,98 

3,59 

3,36 

3,20 

3,09 

3,01 

2,95 

2,90 

2,85 

12 

4,75 

3,89 

3,49 

3,26 

3,11 

3,00 

2,91 

2,85 

2,80 

2,75 

13 

4,67 

3,81 

3,41 

3,18 

3,03 

2,92 

2,83 

2,77 

2,71 

2,67 

14 

4,60 

3,74 

3,34 

3,11 

2,96 

2,85 

2,76 

2,70 

2,65 

2,60 

15 

4,54 

3,68 

3,29 

3,06 

2,90 

2,79 

2,71 

2,64 

2,59 

2,54 

16 

4,49 

3,63 

3,24 

3,01 

2,85 

2,74 

2,66 

2,59 

2,54 

2,49 

17 

4,45 

3,59 

3,20 

2,96 

2,81 

2,70 

2,61 

2,55 

2,49 

2,45 

18 

4,41 

3,55 

3,16 

2,93 

2,77 

2,66 

2,58 

2,51 

2,46 

2,41 

19 

4,38 

3,52 

3,13 

2,90 

2,74 

2,63 

2,54 

2,48 

2,42 

2,38 

20 

4,35 

3,49 

3,10 

2,87 

2,71 

2,60 

2,51 

2,45 

2,39 

2,35 

21 

4,32 

3,47 

3,07 

2,84 

2,68 

2,57 

2,49 

2,42 

2,37 

2,32 

22 

4,30 

3,44 

3,05 

2,82 

2,66 

2,55 

2,46 

2,40 

2,34 

2,30 

23 

4,28 

3,42 

3,03 

2,80 

2,64 

2,53 

2,44 

2,37 

2,32 

2,27 

24 

4,26 

3,40 

3,01 

2,78 

2,62 

2,51 

2,42 

2,36 

2,30 

2,25 

25 

4,24 

3,39 

2,99 

2,76 

2,60 

2,49 

2,40 

2,34 

2,28 

2,24 

26 

4,23 

3,37 

2,98 

2,74 

2,59 

2,47 

2,39 

2,32 

2,27 

2,22 

27 

4,21 

3,35 

2,96 

2,73 

2,57 

2,46 

2,37 

2,31 

2,25 

2,20 

28 

4,20 

3,34 

2,95 

2,71 

2,56 

2,45 

2,36 

2,29 

2,24 

2,19 

29 

4,18 

3,33 

2,93 

2,70 

2,55 

2,43 

2,35 

2,28 

2,22 

2,18 

30 

4,17 

3,32 

2,92 

2,69 

2,53 

2,42 

2,33 

2,27 

2,21 

2,16 

35 

4,12 

3,27 

2,87 

2,64 

2,49 

2,37 

2,29 

2,22 

2,16 

2,11 

40 

4,08 

3,23 

2,84 

2,61 

2,45 

2,34 

2,25 

2,18 

2,12 

2,08 

50 

4,03 

3,18 

2,79 

2,56 

2,40 

2,29 

2,20 

2,13 

2,07 

2,03 

60 

4,00 

3,15 

2,76 

2,53 

2,37 

2,25 

2,17 

2,10 

2,04 

1,99 

80 

3,96 

3,11 

2,72 

2,49 

2,33 

2,21 

2,13 

2,06 

2,00 

1,95 

100 

3,94 

3,09 

2,70 

2,46 

2,31 

2,19 

2,10 

2,03 

1,97 

1,93 

200 

3,89 

3,04 

2,65 

2,42 

2,26 

2,14 

2,06 

1,98 

1,93 

1,88 

500 

3,86 

3,01 

2,62 

2,39 

2,23 

2,12 

2,03 

1,96 

1,90 

1,85 

1000 

3,85 

3,01 

2,61 

2,38 

2,22 

2,11 

2,02 

1,95 

1,89 

1,84 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA VI. DISTRI UCI N 
a = 0 05 
(Continua i n) 


2 

t = gra os eliberta el numera or 

11 

12 

15 

20 

25 

0 

0 

50 

100 

1000 

1 

242,98 

243,91 

245,96 

248,01 

249,26 

250,08 

251,15 

251,77 

253,01 

254,17 

2 

19,40 

19,41 

19,43 

19,45 

19,46 

19,46 

19,47 

19,48 

19,49 

19,50 

3 

8,76 

8,74 

8,70 

8,66 

8,63 

8,62 

8,59 

8,58 

8,55 

8,53 

4 

5,94 

5,91 

5,86 

5,80 

5,77 

5,74 

5,72 

5,70 

5,66 

5,63 

5 

4,70 

4,68 

4,62 

4,56 

4,52 

4,50 

4,46 

4,44 

4,41 

4,37 

6 

4,03 

4,00 

3,94 

3,87 

3,84 

3,81 

3,77 

3,75 

3,71 

3,67 

7 

3,60 

3,57 

3,51 

3,44 

3,40 

3,38 

3,34 

3,32 

3,27 

3,23 

8 

3,31 

3,28 

3,22 

3,15 

3,11 

3,08 

3,04 

3,02 

2,97 

2,93 

9 

3,10 

3,07 

3,01 

2,94 

2,89 

2,86 

2,83 

2,80 

2,76 

2,71 

10 

2,94 

2,91 

2,85 

2,77 

2,73 

2,70 

2,66 

2,64 

2,59 

2,54 

11 

2,82 

2,79 

2,72 

2,65 

2,60 

2,57 

2,53 

2,51 

2,46 

2,41 

12 

2,72 

2,69 

2,62 

2,54 

2,50 

2,47 

2,43 

2,40 

2,35 

2,30 

13 

2,63 

2,60 

2,53 

2,46 

2,41 

2,38 

2,34 

2,31 

2,26 

2,21 

14 

2,57 

2,53 

2,46 

2,39 

2,34 

2,31 

2,27 

2,24 

2,19 

2,14 

15 

2,51 

2,48 

2,40 

2,33 

2,28 

2,25 

2,20 

2,18 

2,12 

2,07 

16 

2,46 

2,42 

2,35 

2,28 

2,23 

2,19 

2,15 

2,12 

2,07 

2,02 

17 

2,41 

2,38 

2,31 

2,23 

2,18 

2,15 

2,10 

2,08 

2,02 

1,97 

18 

2,37 

2,34 

2,27 

2,19 

2,14 

2,11 

2,06 

2,04 

1,98 

1,92 

19 

2,34 

2,31 

2,23 

2,16 

2,11 

2,07 

2,03 

2,00 

1,94 

1,88 

20 

2,31 

2,28 

2,20 

2,12 

2,07 

2,04 

1,99 

1,97 

1,91 

1,85 

21 

2,28 

2,25 

2,18 

2,10 

2,05 

2,01 

1,96 

1,94 

1,88 

1,82 

22 

2,26 

2,23 

2,15 

2,07 

2,02 

1,98 

1,94 

1,91 

1,85 

1,79 

23 

2,24 

2,20 

2,13 

2,05 

2,00 

1,96 

1,91 

1,88 

1,82 

1,76 

24 

2,22 

2,18 

2,11 

2,03 

1,97 

1,94 

1,89 

1,86 

1,80 

1,74 

25 

2,20 

2,16 

2,09 

2,01 

1,96 

1,92 

1,87 

1,84 

1,78 

1,72 

26 

2,18 

2,15 

2,07 

1,99 

1,94 

1,90 

1,85 

1,82 

1,76 

1,70 

27 

2,17 

2,13 

2,06 

1,97 

1,92 

1,88 

1,84 

1,81 

1,74 

1,68 

28 

2,15 

2,12 

2,04 

1,96 

1,91 

1,87 

1,82 

1,79 

1,73 

1,66 

29 

2,14 

2,10 

2,03 

1,94 

1,89 

1,85 

1,81 

1,77 

1,71 

1,65 

30 

2,13 

2,09 

2,01 

1,93 

1,88 

1,84 

1,79 

1,76 

1,70 

1,63 

35 

2,07 

2,04 

1,96 

1,88 

1,82 

1,79 

1,74 

1,70 

1,63 

1,57 

40 

2,04 

2,00 

1,92 

1,84 

1,78 

1,74 

1,69 

1,66 

1,59 

1,52 

50 

1,99 

1,95 

1,87 

1,78 

1,73 

1,69 

1,63 

1,60 

1,52 

1,45 

60 

1,95 

1,92 

1,84 

1,75 

1,69 

1,65 

1,59 

1,56 

1,48 

1,40 

80 

1,91 

1,88 

1,79 

1,70 

1,64 

1,60 

1,54 

1,51 

1,43 

1,34 

100 

1,89 

1,85 

1,77 

1,68 

1,62 

1,57 

1,52 

1,48 

1,39 

1,30 

200 

1,84 

1,80 

1,72 

1,62 

1,56 

1,52 

1,46 

1,41 

1,32 

1,21 

500 

1,81 

1,77 

1,69 

1,59 

1,53 

1,48 

1,42 

1,38 

1,28 

1,14 

1000 

1,80 

1,76 

1,68 

1,58 

1,52 

1,47 

1,41 

1,36 

1,26 

1,11 






















































GLOSARIO 


855 


TA LA VI. DISTRI UCI N 
a = 001 
(Continua i n) 


2 

1 = gra os eliberta el numera or 

1 

2 



5 

6 




10 

1 

4 . 052,00 

4 . 999,50 

5 . 403,00 

5 . 625,00 

5 . 764,00 

5 . 859,00 

5 . 928,0 

5 . 982,0 

6 . 022,0 

6 . 056,0 

2 

98,50 

99,00 

99,17 

99,25 

99,30 

99,33 

99,36 

99,37 

99,39 

99,40 

3 

34,12 

30,82 

29,46 

28,71 

28,24 

27,91 

27,67 

27,50 

27,34 

27,22 

4 

21,20 

18,00 

16,69 

15,98 

15,52 

15,21 

14,98 

14,80 

14,66 

14,55 

5 

16,26 

13,27 

12,06 

11,39 

10,97 

10,67 

10,46 

10,29 

10,16 

10,05 

6 

13,75 

10,92 

9,78 

9,15 

8,75 

8,47 

8,26 

8,10 

7,98 

7,87 

7 

12,25 

9,55 

8,45 

7,85 

7,46 

7,19 

6,99 

6,84 

6,72 

6,62 

8 

11,26 

8,65 

7,59 

7,01 

6,63 

6,37 

6,18 

6,03 

5,91 

5,81 

9 

10,56 

8,02 

6,99 

6,42 

6,06 

5,80 

5,61 

5,47 

5,35 

5,26 

10 

10,04 

7,56 

6,55 

5,99 

5,64 

5,39 

5,20 

5,06 

4,94 

4,85 

11 

9,65 

7,21 

6,22 

5,67 

5,32 

5,07 

4,89 

4,74 

4,63 

4,54 

12 

9,33 

6,93 

5,95 

5,41 

5,06 

4,82 

4,64 

4,50 

4,39 

4,30 

13 

9,07 

6,70 

5,74 

5,21 

4,86 

4,62 

4,44 

4,30 

4,19 

4,10 

14 

8,86 

6,51 

5,56 

5,04 

4,69 

4,46 

4,28 

4,14 

4,03 

3,80 

15 

8,68 

6,36 

5,42 

4,89 

4,56 

4,32 

4,14 

4,00 

3,89 

3,80 

16 

8,53 

6,23 

5,29 

4,77 

4,44 

4,20 

4,03 

3,89 

3,78 

3,69 

17 

8,40 

6,11 

5,18 

4,67 

4,34 

4,10 

3,93 

3,79 

3,68 

3,59 

18 

8,29 

6,01 

5,09 

4,58 

4,25 

4,01 

3,84 

3,71 

3,60 

3,51 

19 

8,18 

5,93 

5,01 

4,50 

4,17 

3,94 

3,77 

3,63 

3,52 

3,43 

20 

8,10 

5,85 

4,94 

4,43 

4,10 

3,87 

3,70 

3,56 

3,46 

3,37 

21 

8,02 

5,78 

4,87 

4,37 

4,04 

3,81 

3,64 

3,51 

3,40 

3,31 

22 

7,95 

5,72 

4,82 

4,31 

3,99 

3,76 

3,59 

3,45 

3,35 

3,26 

23 

7,88 

5,66 

4,76 

4,26 

3,94 

3,71 

3,54 

3,41 

3,30 

3,21 

24 

7,82 

5,61 

4,72 

4,22 

3,90 

3,67 

3,50 

3,36 

3,26 

3,17 

25 

7,77 

5,57 

4,68 

4,18 

3,85 

3,63 

3,46 

3,32 

3,22 

3,13 

26 

7,72 

5,53 

4,64 

4,14 

3,82 

3,59 

3,42 

3,29 

3,18 

3,09 

27 

7,68 

5,49 

4,60 

4,11 

3,78 

3,56 

3,39 

3,26 

3,15 

3,06 

28 

7,64 

5,45 

4,57 

4,07 

3,75 

3,53 

3,36 

3,23 

3,12 

3,03 

29 

7,60 

5,42 

4,54 

4,04 

3,73 

3,50 

3,33 

3,20 

3,09 

3,00 

30 

7,56 

5,39 

4,51 

4,02 

3,70 

3,47 

3,30 

3,17 

3,07 

2,98 

35 

7,42 

5,27 

4,40 

3,91 

3,59 

3,37 

3,20 

3,07 

2,96 

2,88 

40 

7,31 

5,18 

4,31 

3,83 

3,51 

3,29 

3,12 

2,99 

2,89 

2,80 

50 

7,17 

5,06 

4,20 

3,72 

3,41 

3,19 

3,02 

2,89 

2,78 

2,70 

60 

7,08 

4,98 

4,13 

3,65 

3,34 

3,12 

2,95 

2,82 

2,72 

2,63 

80 

6,96 

4,88 

4,04 

3,56 

3,26 

3,04 

2,87 

2,74 

2,64 

2,55 

100 

6,90 

4,82 

3,98 

3,51 

3,21 

2,99 

2,82 

2,69 

2,59 

2,50 

200 

6,76 

4,71 

3,88 

3,41 

3,11 

2,89 

2,73 

2,60 

2,50 

2,41 

500 

6,69 

4,65 

3,82 

3,36 

3,05 

2,84 

2,68 

2,55 

2,44 

2,36 

1000 

6,66 

4,63 

3,80 

3,34 

3,04 

2,82 

2,66 

2,53 

2,43 

2,34 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA VI. DISTRI UCI N 
a = 001 
(Continua i n) 


2 

j = gra os eliberta el numera or 

11 

12 

15 

20 

25 

0 

0 

50 

100 

1000 

1 

6 . 082,00 

6 . 106,00 

6 . 157,00 

6 . 209,00 

6 . 260,00 

6 . 261,00 

6 . 287,00 

6 . 302,00 

6 . 334,00 

6 . 366,0 

2 

99,41 

99,42 

99,43 

99,45 

99,46 

99,46 

99,47 

99,48 

99,49 

99,51 

3 

27,12 

27,03 

26,85 

26,67 

26,58 

26,50 

26,41 

26,35 

26,24 

26,14 

4 

14,45 

14,37 

14,19 

14,02 

13,91 

13,84 

13,75 

13,69 

13,58 

13,48 

5 

9,96 

9,89 

9,72 

9,55 

9,45 

9,38 

9,30 

9,24 

9,13 

9,03 

6 

7,79 

7,72 

7,56 

7,40 

7,29 

7,23 

7,15 

7,09 

6,99 

6,89 

7 

6,54 

6,47 

6,31 

6,16 

6,06 

5,99 

5,91 

5,86 

5,75 

5,66 

8 

5,73 

5,67 

5,52 

5,30 

5,26 

5,20 

5,12 

5,07 

4,96 

4,87 

9 

5,18 

5,11 

4,96 

4,81 

4,71 

4,65 

4,57 

4,52 

4,41 

4,32 

10 

4,77 

4,71 

4,56 

4,41 

4,31 

4,25 

4,17 

4,12 

4,01 

3,92 

11 

4,46 

4,40 

4,25 

4,10 

4,00 

3,94 

3,86 

3,81 

3,71 

3,61 

12 

4,22 

4,16 

4,01 

3,86 

3,76 

3,70 

3,62 

3,57 

3,47 

3,37 

13 

4,02 

3,96 

3,82 

3,66 

3,57 

3,51 

3,43 

3,38 

3,27 

3,18 

14 

3,86 

3,80 

3,66 

3,51 

3,41 

3,35 

3,27 

3,22 

3,11 

3,02 

15 

3,73 

3,67 

3,52 

3,37 

3,28 

3,21 

3,13 

3,08 

2,98 

2,88 

16 

3,62 

3,55 

3,41 

3,26 

3,16 

3,10 

3,02 

2,97 

2,86 

2,76 

17 

3,52 

3,46 

3,31 

3,16 

3,07 

3,00 

2,92 

2,87 

2,76 

2,66 

18 

3,43 

3,37 

3,23 

3,08 

2,98 

2,92 

2,84 

2,78 

2,68 

2,58 

19 

3,36 

3,30 

3,15 

3,00 

2,91 

2,84 

2,76 

2,71 

2,60 

2,50 

20 

3,29 

3,23 

3,09 

2,94 

2,84 

2,78 

2,69 

2,64 

2,54 

2,43 

21 

3,24 

3,17 

3,03 

2,88 

2,78 

2,72 

2,64 

2,58 

2,48 

2,37 

22 

3,18 

3,12 

2,98 

2,83 

2,73 

2,67 

2,58 

2,53 

2,42 

2,32 

23 

3,14 

3,07 

2,93 

2,78 

2,69 

2,62 

2,54 

2,48 

2,37 

2,27 

24 

3,09 

3,03 

2,89 

2,74 

2,64 

2,58 

2,49 

2,44 

2,33 

2,22 

25 

3,06 

2,99 

2,85 

2,70 

2,60 

2,54 

2,45 

2,40 

2,29 

2,18 

26 

3,02 

2,96 

2,81 

2,66 

2,57 

2,50 

2,42 

2,36 

2,25 

2,14 

27 

2,99 

2,93 

2,78 

2,63 

2,54 

2,47 

2,38 

2,33 

2,22 

2,11 

28 

2,96 

2,90 

2,75 

2,60 

2,51 

2,44 

2,35 

2,30 

2,19 

2,08 

29 

2,93 

2,87 

2,73 

2,57 

2,48 

2,41 

2,33 

2,27 

2,16 

2,05 

30 

2,91 

2,84 

2,70 

2,55 

2,45 

2,39 

2,30 

2,24 

2,13 

2,02 

35 

2,80 

2,74 

2,60 

2,44 

2,35 

2,28 

2,19 

2,14 

2,02 

1,90 

40 

2,73 

2,66 

2,52 

2,37 

2,27 

2,20 

2,11 

2,06 

1,94 

1,82 

50 

2,62 

2,56 

2,42 

2,27 

2,17 

2,10 

2,01 

1,95 

1,82 

1,70 

60 

2,56 

2,50 

2,35 

2,20 

2,10 

2,03 

1,94 

1,88 

1,75 

1,62 

80 

2,48 

2,42 

2,27 

2,12 

2,01 

1,94 

1,85 

1,79 

1,65 

1,51 

100 

2,43 

2,37 

2,22 

2,07 

1,97 

1,89 

1,80 

1,74 

1,60 

1,45 

200 

2,34 

2,27 

2,13 

1,97 

1,87 

1,79 

1,69 

1,63 

1,48 

1,30 

500 

2,28 

2,22 

2,07 

1,92 

1,81 

1,74 

1,63 

1,57 

1,41 

1,20 

1000 

2,27 

2,20 

2,06 

1,90 

1,79 

1,72 

1,61 

1,54 

1,38 

1,16 
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TA LA VI. DISTRI UCI N 
a = 0 025 
(Continua i n) 






! = gra 

os eliberta el numera or 



2 

1 

2 



5 

6 




10 

1 

648 

800 

864 

900 

922 

937 

948 

957 

963 

969 

2 

38,5 

39,0 

39,2 

39,2 

39,3 

39,3 

39,4 

39,4 

39,4 

39,4 

3 

17,4 

16,0 

15,4 

15,1 

14,9 

14,7 

14,6 

14,5 

14,5 

14,4 

4 

12,2 

10,6 

9,98 

9,60 

9,36 

9,20 

9,07 

8,98 

8,90 

8,84 

5 

10,0 

8,43 

7,76 

7,39 

7,15 

6,98 

6,85 

6,76 

6,68 

6,62 

6 

8,81 

7,26 

6,60 

6,23 

5,99 

5,82 

5,70 

5,60 

5,52 

5,46 

7 

8,07 

6,54 

5,89 

5,52 

5,29 

5,12 

4,99 

4,90 

4,82 

4,76 

8 

7,57 

6,06 

5,42 

5,05 

4,82 

4,65 

4,53 

4,43 

4,36 

4,30 

9 

7,21 

5,71 

5,08 

4,72 

4,48 

4,32 

4,20 

4,10 

4,03 

3,96 

10 

6,94 

5,46 

4,83 

4,47 

4,24 

4,07 

3,95 

3,85 

3,78 

3,72 

11 

6,72 

5,26 

4,63 

4,28 

4,04 

3,88 

3,76 

3,66 

3,59 

3,53 

12 

6,55 

5,10 

4,47 

4,12 

3,89 

3,73 

3,61 

3,51 

3,44 

3,37 

13 

6,41 

4,97 

4,35 

4,00 

3,77 

3,60 

3,48 

3,39 

3,31 

3,25 

14 

6,30 

4,86 

4,24 

3,89 

3,66 

3,50 

3,38 

3,28 

3,21 

3,15 

15 

6,20 

4,77 

4,15 

3,80 

3,58 

3,41 

3,29 

3,20 

3,12 

3,06 

16 

6,12 

4,69 

4,08 

3,73 

3,50 

3,34 

3,22 

3,12 

3,05 

2,99 

17 

6,04 

4,62 

4,01 

3,66 

3,44 

3,28 

3,16 

3,06 

2,98 

2,92 

18 

5,98 

4,56 

3,95 

3,61 

3,38 

3,22 

3,10 

3,01 

2,93 

2,87 

19 

5,92 

4,51 

3,90 

3,56 

3,33 

3,17 

3,05 

2,96 

2,88 

2,82 

20 

5,87 

4,46 

3,86 

3,51 

3,29 

3,13 

3,01 

2,91 

2,84 

2,77 

21 

5,83 

4,42 

3,82 

3,48 

3,25 

3,09 

2,97 

2,87 

2,80 

2,73 

22 

5,79 

4,38 

3,78 

3,44 

3,22 

3,05 

2,93 

2,84 

2,76 

2,70 

23 

5,75 

4,35 

3,75 

3,41 

3,18 

3,02 

2,90 

2,81 

2,73 

2,67 

24 

5,72 

4,32 

3,72 

3,38 

3,15 

2,99 

2,87 

2,78 

2,70 

2,64 

25 

5,69 

4,29 

3,69 

3,35 

3,13 

2,97 

2,85 

2,75 

2,68 

2,61 

30 

5,57 

4,18 

3,59 

3,25 

3,03 

2,87 

2,75 

2,65 

2,57 

2,51 

40 

5,42 

4,05 

3,46 

3,13 

2,90 

2,74 

2,62 

2,53 

2,45 

2,39 

60 

5,29 

3,93 

3,34 

3,01 

2,79 

2,63 

2,51 

2,41 

2,33 

2,27 

120 

5,15 

3,80 

3,23 

2,89 

2,67 

2,52 

2,39 

2,30 

2,22 

2,16 

00 

5,02 

3,69 

3,12 

2,79 

2,57 

2,41 

2,29 

2,19 

2,11 

2,05 
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a = 0 025 
(Continua i n) 





i 

= gra os 

eliberta 

el numera or 



2 

12 

15 

20 

2 

0 

0 

60 

120 

00 

1 

977 

985 

993 

997 

1.001 

1.006 

1.010 

1.014 

1.018 

2 

39,4 

39,4 

39,4 

39,5 

39,5 

39,5 

39,5 

39,5 

39,5 

3 

14,3 

14,3 

14,2 

14,1 

14,1 

14,0 

14,0 

13,9 

13,9 

4 

8,75 

8,66 

8,56 

8,51 

8,46 

8,41 

8,36 

8,31 

8,26 

5 

6,52 

6,43 

6,33 

6,28 

6,23 

6,18 

6,12 

6,07 

6,02 

6 

5,37 

5,27 

5,17 

5,12 

5,07 

5,01 

4,96 

4,90 

4,85 

7 

4,67 

4,57 

4,47 

4,42 

4,36 

4,31 

4,25 

4,20 

4,14 

8 

4,20 

4,10 

4,00 

3,95 

3,89 

3,84 

3,78 

3,73 

3,67 

9 

3,87 

3,77 

3,67 

3,61 

3,56 

3,51 

3,45 

3,39 

3,33 

10 

3,62 

3,52 

3,42 

3,37 

3,31 

3,26 

3,20 

3,14 

3,08 

11 

3,43 

3,33 

3,23 

3,17 

3,12 

3,06 

3,00 

2,94 

2,88 

12 

3,28 

3,18 

3,07 

3,02 

2,96 

2,91 

2,85 

2,79 

2,72 

13 

3,15 

3,05 

2,95 

2,89 

2,84 

2,78 

2,72 

2,66 

2,60 

14 

3,05 

2,95 

2,84 

2,79 

2,73 

2,67 

2,61 

2,55 

2,49 

15 

2,96 

2,86 

2,76 

2,70 

2,64 

2,59 

2,52 

2,46 

2,40 

16 

2,89 

2,79 

2,68 

2,63 

2,57 

2,51 

2,45 

2,38 

2,32 

17 

2,82 

2,72 

2,62 

2,56 

2,50 

2,44 

2,38 

2,32 

2,25 

18 

2,77 

2,67 

2,56 

2,50 

2,44 

2,38 

2,32 

2,26 

2,19 

19 

2,72 

2,62 

2,51 

2,45 

2,39 

2,33 

2,27 

2,20 

2,13 

20 

2,68 

2,57 

2,46 

2,41 

2,35 

2,29 

2,22 

2,16 

2,09 

21 

2,64 

2,53 

2,42 

2,37 

2,31 

2,25 

2,18 

2,11 

2,04 

22 

2,60 

2,50 

2,39 

2,33 

2,27 

2,21 

2,14 

2,08 

2,00 

23 

2,57 

2,47 

2,36 

2,30 

2,24 

2,18 

2,11 

2,04 

1,97 

24 

2,54 

2,44 

2,33 

2,27 

2,21 

2,15 

2,08 

2,01 

1,94 

25 

2,51 

2,41 

2,30 

2,24 

2,18 

2,12 

2,05 

1,98 

1,91 

30 

2,41 

2,31 

2,20 

2,14 

2,07 

2,01 

1,94 

1,87 

1,79 

40 

2,29 

2,18 

2,07 

2,01 

1,94 

1,88 

1,80 

1,72 

1,64 

60 

2,17 

2,06 

1,94 

1,88 

1,82 

1,74 

1,67 

1,58 

1,48 

120 

2,05 

1,95 

1,82 

1,76 

1,69 

1,61 

1,53 

1,43 

1,31 

00 

1,94 

1,93 

1,71 

1,64 

1,57 

1,48 

1,39 

1,27 

1,00 
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LA VII.COE ICIENTESDE SPEARMAN PARA LA CORRELACI N DE RANGO 



Dos e tremos e alores r ti os 
Valores rti os e os olas 


n 

a = 010 

ol = 0 05 

a = 002 

a = 001 

5 

0,900 

_ 

- 

- 

6 

0,829 

0,886 

0,943 

- 

7 

0,714 

0,786 

0,893 

- 

8 

0,643 

0,738 

0,833 

0,881 

9 

0,600 

0,683 

0,783 

0,833 

10 

0,564 

0,648 

0,745 

0,794 

11 

0,523 

0,623 

0,736 

0,818 

12 

0,497 

0,591 

0,703 

0,780 

13 

0,475 

0,566 

0,673 

0,745 

14 

0,457 

0,545 

0,646 

0,716 

15 

0,441 

0,525 

0,623 

0,689 

16 

0,425 

0,507 

0,601 

0,666 

17 

0,412 

0,490 

0,582 

0,645 

18 

0,399 

0,476 

0,564 

0,625 

19 

0,388 

0,462 

0,549 

0,608 

20 

0,377 

0,450 

0,534 

0,591 

21 

0,368 

0,438 

0,521 

0,576 

22 

0,359 

0,428 

0,508 

0,562 

23 

0,351 

0,418 

0,496 

0,549 

24 

0,343 

0,409 

0,485 

0,537 

25 

0,336 

0,400 

0,475 

0,526 

26 

0,329 

0,392 

0,465 

0,515 

27 

0,323 

0,385 

0,456 

0,505 

28 

0,317 

0,377 

0,448 

0,496 

29 

0,311 

0,370 

0,440 

0,487 

30 

0,305 

0,364 

0,432 

0,478 
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ESTADISTICAY MUESTREO 


TA LA VIII. PRUE A DE ILCO ON. 

VALORESCR TICOS DE T EN LA PRUE A DE LOS RANGOS 
DE PARES IGUALADOSDE ILCO ON 



Prueba euna ola 

n 

0 025 

0 01 

0 005 

Prueba e os olas 


0 05 

0 02 

001 

6 

0 

- 

- 

7 

2 

0 

- 

8 

4 

2 

0 

9 

6 

3 

2 

10 

8 

5 

3 

11 

11 

7 

5 

12 

14 

10 

7 

13 

17 

13 

10 

14 

21 

16 

13 

15 

25 

20 

16 

16 

30 

24 

20 

17 

35 

28 

23 

18 

40 

33 

28 

19 

46 

38 

32 

20 

52 

43 

38 

21 

59 

49 

43 

22 

66 

56 

49 

23 

73 

62 

55 

24 

81 

69 

61 

25 

89 

77 

68 


Tomada de la tabla I de Wilcoxon , F . 1949 , Some rapid approximate statistical procedures . Nueva York : American Cyanamid . 
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TA LA I . DISTRI UCI N INOMIAL 























n 

X 

,05 

,10 

,25 

,20 

,25 

,30 

,35 

,40 

,45 

,50 

,55 

,60 

,65 

,70 

,75 

,80 

,85 

,90 

,95 


1 

0 

,9500 

,9000 

,8500 

,8000 

,7500 

,7000 

,6500 

,6000 

,5500 

,5000 

,4500 

,4000 

,3500 

,3000 

,2500 

,2000 

,1500 

,1000 

,0500 


1 

,0500 

,1000 

,1500 

,2000 

,2500 

,3000 

,3500 

,4000 

,4500 

,5000 

,5500 

,6000 

,6500 

,7000 

,7500 

,8000 

,8500 

,9000 

,9500 

2 

0 

,9025 

,8100 

,7225 

,6400 

,5625 

,4900 

,4225 

,3600 

,3025 

,2500 

,2025 

,1600 

,1225 

,0900 

,0625 

,0400 

,0225 

,0100 

,0025 


1 

,0950 

,1800 

,2550 

,3200 

,3750 

,4200 

,4550 

,4800 

,4950 

,5000 

,4950 

,4800 

,4550 

,4200 

,3750 

,3200 

,2550 

,1800 

,0950 


2 

.0025 

,0100 

,0225 

,0400 

,0625 

,0900 

,1225 

,1600 

,2025 

,2500 

,3025 

,3600 

,4225 

,4900 

,5625 

,6400 

,7225 

,8100 

,9025 

3 

0 

,8574 

,7290 

,6141 

,5120 

,4219 

,3430 

,2746 

,2160 

,1664 

,1250 

,0911 

,0640 

,0429 

,0270 

,0156 

,0900 

,0034 

,0010 

,0001 


1 

,1354 

,2430 

,3251 

,3840 

,4219 

,4410 

,4436 

,4320 

,4084 

,3750 

,3341 

,2880 

,2389 

,1890 

,1406 

,0960 

,0574 

,0270 

,0071 


2 

,0071 

,0270 

,0574 

,0960 

,1406 

,1890 

,2389 

,2880 

,3341 

,3750 

,4084 

,4320 

,4436 

,4410 

,4219 

,3840 

,3251 

,2430 

,1354 


3 

,0001 

,0010 

,0034 

,0080 

,0156 

,0270 

,0429 

,0640 

,0911 

,1250 

,1664 

,2160 

,2746 

,3430 

,4219 

,5120 

,6141 

,7290 

,8574 

4 

0 

,8145 

,6561 

,5220 

,4096 

,3164 

,2401 

,1785 

,1296 

,0915 

,0625 

,0410 

,0256 

,0150 

,0081 

,0039 

,0016 

,0005 

,0001 

,0000 


1 

,1715 

,2916 

,3685 

,4096 

,4219 

,4116 

,3845 

,3456 

,2995 

,2500 

,2005 

,1536 

,1115 

,0756 

,0469 

,0256 

,0115 

,0036 

,0005 


2 

.0135 

,0486 

,0975 

,1536 

,2109 

,2646 

,3105 

,3456 

,3675 

,3750 

,3675 

,3456 

,3105 

,2646 

,2109 

,1536 

,0975 

,0486 

,0135 


3 

,0005 

,0036 

,0115 

,0256 

,0469 

,0756 

,1115 

,1536 

,2005 

,2500 

,2995 

,3456 

,3845 

,4116 

,4219 

,4096 

,3685 

,2916 

,1715 


4 

,0000 

,0001 

,0005 

,0016 

,0019 

,0081 

,0150 

,0256 

,0410 

,0625 

,0915 

,1296 

,1785 

,2401 

,3164 

,4096 

,5220 

,6561 

,8145 

5 

0 

,7738 

,5905 

,4437 

,3277 

,2373 

,1681 

,1160 

,0778 

,0503 

,0313 

,0185 

,0102 

,0053 

,0024 

,0010 

,0003 

,0001 

,0000 

,0000 


1 

,2036 

,3281 

,3915 

,4096 

,3955 

,3602 

,3124 

,2592 

,2059 

,1563 

,1128 

,0768 

,0488 

,0284 

,0146 

,0064 

,0022 

,0004 

,0000 


2 

,0214 

,0729 

,1382 

,2048 

,2637 

,3087 

,3364 

,3456 

,3369 

,3125 

,2757 

,2304 

,1181 

,1323 

,0879 

,0512 

,0244 

,0081 

,0011 


3 

,0011 

,0081 

,0244 

,0512 

,0879 

,1323 

,1181 

,2304 

,2757 

,3125 

,3369 

,3456 

,3364 

,3087 

,2637 

,2048 

,1382 

,0729 

,0214 


4 

,0000 

,0004 

,0022 

,0064 

,0146 

,0283 

,0488 

,0768 

,1128 

,1652 

,2059 

,2592 

,3124 

,3601 

,3955 

,4096 

,3915 

,3281 

,2036 


5 

,0000 

,0000 

,0001 

,0003 

,0010 

,0024 

,0053 

,0102 

,0185 

,0312 

,0503 

,0778 

,1160 

,1681 

,2373 

,3277 

,4437 

,5905 

,7738 

6 

0 

,7351 

,5314 

,3771 

,2621 

,1780 

,1176 

,0754 

,0467 

,0277 

,0156 

,0083 

,0041 

,0018 

,0007 

,0002 

,0001 

,0000 

,0000 

,0000 


1 

,2321 

,3543 

,3993 

,3932 

,3560 

,3025 

,2437 

,1866 

,1359 

,0938 

,0609 

,0369 

,0205 

,0102 

,0044 

,0015 

,0004 

,0001 

,0000 


2 

,0305 

,0984 

,1762 

,2458 

,2966 

,3241 

,3280 

,3110 

,2780 

,2344 

,1861 

,1382 

,0951 

,0595 

,0330 

,0154 

,0055 

,0012 

,0001 


3 

,0021 

,0146 

,0415 

,0819 

,1318 

,1852 

,2355 

,2765 

,3032 

,3125 

,3032 

,2765 

,2355 

,1852 

,1318 

,0819 

,0415 

,0146 

,0021 


4 

,0001 

,0012 

,0055 

,0154 

,0330 

,0595 

,0951 

,1382 

,1861 

,2344 

,2780 

,3110 

,3280 

,3241 

,2966 

,2458 

,1762 

,0984 

,0305 


5 

,0000 

,0001 

,0004 

,0015 

,0044 

,0102 

,0205 

,0369 

,0609 

,0937 

,1359 

,1866 

,2437 

,3025 

,3560 

,3932 

,3993 

,3543 

,2321 


6 

,0000 

,0000 

,0000 

,0001 

,0002 

,0007 

,0018 

,0041 

,0083 

,0156 

,0277 

,0467 

,0754 

,1176 

,1780 

,2621 

,3771 

,5314 

,7351 

7 

0 

,6983 

,4783 

,3206 

,2097 

,1355 

,0824 

,0490 

,0280 

,0152 

,0078 

,0037 

,0016 

,0006 

,0002 

,0001 

,0000 

,0000 

,0000 

,0000 


1 

,2573 

,3720 

,3960 

,3670 

,3115 

,2471 

,1848 

,1306 

,0872 

,0547 

,0320 

,0172 

,0084 

,0036 

,0013 

,0004 

,0001 

,0000 

,0000 


2 

,0406 

,1240 

,2097 

,2753 

,3115 

,3177 

,2985 

,2613 

,2140 

,1641 

,1172 

,0774 

,0466 

,0250 

,0115 

,0043 

,0012 

,0002 

,0000 


3 

,0036 

,0230 

,0617 

,1147 

,1730 

,2269 

,2679 

,2903 

,2918 

,2734 

,2388 

,1935 

,1442 

,0972 

,0577 

,0287 

,0109 

,0026 

,0002 


4 

,0002 

,0026 

,0109 

,0287 

,0577 

,0972 

,1442 

,1935 

,2388 

,2734 

,2918 

,2903 

,2679 

,2269 

,1730 

,1147 

,0617 

,0230 

,0036 


5 

,0000 

,0002 

,0012 

,0043 

,0115 

,0250 

,0466 

,0774 

,1172 

,1641 

,2140 

,2613 

,2985 

,3177 

,3115 

,2753 

,2097 

,1240 

,0406 


6 

,0000 

,0000 

,0001 

,0004 

,0013 

,0036 

,0084 

,0172 

,0320 

,0547 

,0872 

,1306 

,1848 

,2471 

,3115 

,3670 

,3960 

,3720 

,2573 


7 

,0000 

,0000 

,0000 

,0000 

,0001 

,0002 

,0006 

,0016 

,0037 

,0078 

,0152 

,0280 

,0490 

,0824 

,1335 

,2097 

,3206 

,4783 

,6983 
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8 

0 

,6634 

,4305 

,2725 

,1678 

,1001 

,0576 

,0319 

,0168 

,0084 

,0039 

,0017 

,0007 

,0002 

,0001 

,0000 

,0000 

,0000 

,0000 

,0000 


1 

,2793 

,3826 

,3847 

,3355 

,2670 

,1977 

,1373 

,0896 

,0548 

,0313 

,0164 

,0079 

,0033 

,0012 

,0004 

,0001 

,0000 

,0000 

,0000 


2 

,0515 

,1488 

,2376 

,2936 

,3115 

,2965 

,2587 

,2090 

,1569 

,1094 

,0703 

,0413 

,0217 

,0100 

,0038 

,0011 

,0002 

,0000 

,0000 


3 

,0054 

,0331 

,0839 

,1468 

,2076 

,2541 

,2786 

,2787 

,2568 

,2188 

,1719 

,1239 

,0808 

,0467 

,0231 

,0092 

,0026 

,0004 

,0000 


4 

,0004 

,0046 

,0185 

,0459 

,0865 

,1361 

,1875 

,2322 

,2627 

,2734 

,2627 

,2322 

,1875 

,1361 

,0865 

,0459 

,0185 

,0046 

,0004 


5 

,0000 

,0004 

,0026 

,0092 

,0231 

,0467 

,0808 

,1239 

,1719 

,2188 

,2568 

,2787 

,2786 

,2541 

,2076 

,1468 

,0839 

,0331 

,0054 


6 

,0000 

,0000 

,0002 

,0011 

,0038 

,0100 

,0217 

,0413 

,0703 

,1094 

,1569 

,2090 

,2587 

,2965 

,3115 

,2936 

,2376 

,1488 

,0515 


7 

,0000 

,0000 

,0000 

,0001 

,0004 

,0012 

,0033 

,0079 

,0164 

,0312 

,0548 

,0896 

,1373 

,1977 

,2670 

,3355 

,3847 

,3826 

,2793 


8 

,0000 

,0000 

,0000 

,0000 

,0000 

,0001 

,0002 

,0007 

,0017 

,0039 

,0084 

,0168 

,0319 

,0576 

,1001 

,1678 

,2725 

,4305 

,6636 

9 

0 

,6302 

,3874 

,2316 

,1342 

,0751 

,0404 

,0207 

,0101 

,0046 

,0020 

,0008 

,0003 

,0001 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 


1 

,2986 

,3874 

,3679 

,3020 

,2253 

,1556 

,1004 

,0605 

,0339 

,0176 

,0083 

,0035 

,0013 

,0004 

,0001 

,0000 

,0000 

,0000 

,0000 


2 

,0629 

,1722 

,2597 

,3020 

,3003 

,2668 

,2162 

,1612 

,1110 

,0703 

,0407 

,0212 

,0098 

,0039 

,0012 

,0003 

,0000 

,0000 

,0000 


3 

,0077 

,0446 

,1069 

,1762 

,2326 

,2668 

,2716 

,2508 

,2119 

,1641 

,1160 

,0743 

,0424 

,0210 

,0087 

,0028 

,0006 

,0001 

,0000 


4 

,0006 

,0074 

,0283 

,0661 

,1168 

,1715 

,2194 

,2508 

,2600 

,2461 

,2128 

,1672 

,1181 

,0735 

,0389 

,0165 

,0050 

,0008 

,0000 


5 

,0000 

,0008 

,0050 

,0165 

,0389 

,0735 

,1181 

,1672 

,2128 

,2461 

,2600 

,2508 

,2194 

,1715 

,1168 

, 0,661 

,0283 

,0074 

,0006 


6 

,0000 

,0001 

,0006 

,0028 

,0087 

,0210 

,0424 

,0743 

,1160 

,1641 

,2119 

,2508 

,2716 

,2668 

,2336 

,1762 

,1069 

,0446 

,0077 


7 

,0000 

,0000 

,0000 

,0003 

,0012 

,0039 

,0098 

,0212 

,0407 

,0703 

,1110 

,1612 

,2162 

,2668 

,3003 

,3020 

,2597 

,1722 

,0629 


8 

,0000 

,0000 

,0000 

,0000 

,0001 

,0004 

,0013 

,0035 

,0083 

,0176 

,0339 

,0605 

,1004 

,1556 

,2253 

,3020 

,3679 

,3874 

,2986 


9 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0001 

,0003 

,0008 

,0020 

,0046 

,0101 

,0207 

,0404 

,0751 

,1342 

,2316 

,3874 

,6302 

10 

0 

,5987 

,3847 

,1969 

,1074 

,0563 

,0282 

,0135 

,0060 

,0025 

,0010 

,0003 

,0001 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 


1 

,3151 

,3874 

,3474 

,2684 

,1877 

,1211 

,0725 

,0403 

,0207 

,0098 

,0042 

,0016 

,0005 

,0001 

,0000 

,0000 

,0000 

,0000 

,0000 


2 

,0746 

,1937 

,2759 

,3020 

,2816 

,2335 

,1757 

,1209 

,0763 

,0439 

,0229 

,0106 

,0043 

,0014 

,0004 

,0001 

,0000 

,0000 

,0000 


3 

,0105 

,0574 

,1298 

,2013 

,2503 

,2668 

,2522 

,2150 

,1665 

,1172 

,0746 

,0425 

,0212 

,0090 

,0031 

,0008 

,0001 

,0000 

,0000 


4 

,0010 

,0112 

,0401 

,0881 

,1460 

,2001 

,2377 

,2508 

,2384 

,2051 

,1596 

,1115 

,0689 

,0368 

,0162 

,0055 

,0012 

,0001 

,0000 


5 

,0001 

,0015 

,0085 

,0264 

,0584 

,1029 

,1536 

,2007 

,2340 

,2461 

,2340 

,2007 

,1536 

,1029 

,0584 

,0264 

,0085 

,0015 

,0001 


6 

,0000 

,0001 

,0012 

,0055 

,0162 

,0368 

,0689 

,1115 

,1596 

,2051 

,2384 

,2508 

,2377 

,2001 

,1460 

,0881 

,0401 

,0112 

,0010 


7 

,0000 

,0000 

,0001 

,0008 

,0031 

,0090 

,0212 

,0425 

,0746 

,1172 

,1665 

,2150 

,2522 

,2668 

,2503 

,2013 

,1298 

,0574 

,0105 


8 

,0000 

,0000 

,0000 

,0001 

,0004 

,0014 

,0043 

,0106 

,0229 

,0439 

,0763 

,1209 

,1757 

,2335 

,2816 

,3020 

,2759 

,1937 

,0746 


9 

,0000 

,0000 

,0000 

,0000 

,0000 

,0001 

,0005 

,0016 

,0042 

,0098 

,0207 

,0403 

,0725 

,1211 

,1877 

,2684 

,3473 

,3874 

,3151 


10 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0001 

,0003 

,1098 

,0025 

,0060 

,0135 

,0282 

,0563 

,1074 

,1969 

,3487 

,5987 

11 

0 

,5688 

,3138 

,1673 

,0859 

,0422 

,0198 

,0088 

,0036 

,0014 

,0005 

,0002 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 


1 

,3293 

,3835 

,3248 

,2362 

,1549 

,0932 

,0518 

,0266 

,0125 

,0054 

,0021 

,0007 

,0002 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 


2 

,0867 

,2131 

,2866 

,2953 

,2581 

,1998 

,1395 

,0887 

,0513 

,0269 

,0216 

,0052 

,0018 

,0005 

,0001 

,0000 

,0000 

,0000 

,0000 


3 

,0137 

,0710 

,1517 

,2215 

,2581 

,2568 

,2254 

,1774 

,1259 

,0806 

,0462 

,0234 

,0102 

,0037 

,0011 

,0002 

,0000 

,0000 

,0000 


4 

,0014 

,0158 

,0536 

,1107 

,1721 

,2201 

,2428 

,2365 

,2060 

,1611 

,1128 

,0701 

,0379 

,0173 

,0064 

,0017 

,0003 

,0000 

,0000 


5 

,0001 

,0025 

,0132 

,0388 

,0803 

,1321 

,1830 

,2207 

,2360 

,2256 

,1931 

,1471 

,0985 

,0566 

,0268 

,0097 

,0023 

,0003 

,0000 


6 

,0000 

,0003 

,0023 

,0097 

,0268 

,0566 

,0985 

,1471 

,1931 

,2256 

,2360 

,2207 

,1830 

,1321 

,0803 

,0388 

,0132 

,0025 

,0001 


7 

,0000 

,0000 

,0003 

,0017 

,0064 

,0173 

,0379 

,0701 

,1128 

,1611 

,2060 

,2365 

,2428 

,2201 

,1721 

,1107 

,0536 

,0158 

,0014 


8 

,0000 

,0000 

,0000 

,0002 

,0011 

,0037 

,0102 

,0234 

,0462 

,0806 

,1259 

,1774 

,2254 

,2568 

,2581 

,2215 

,1517 

,0710 

,0137 


9 

,0000 

,0000 

,0000 

,0000 

,0001 

,0005 

,0018 

,0052 

,0126 

,0269 

,0513 

,0887 

,1395 

,1998 

,2581 

,2953 

,2866 

,2131 

,0867 


10 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0002 

,0007 

,0021 

,0054 

,0125 

,0266 

,0518 

,0932 

,1549 

,2362 

,3248 

,3835 

,3293 


11 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0002 

,0005 

,0014 

,0036 

,0088 

,0198 

,0422 

,0859 

,1673 

,3138 

.5688 



























0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 


GLOSARIO 


863 


TA LA I . DISTRI UCI N INOMIAL (Continua i n) 


,5404 

,2824 

,1422 

,0687 

,0317 

,0138 

,0057 

,0022 

,0008 

,0002 

,0001 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,3413 

,3766 

,3012 

,2062 

,1267 

,0712 

,0368 

,0174 

,0075 

,0029 

,0010 

,0003 

,0001 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0988 

,2301 

,2924 

,2835 

,2323 

,1678 

,1088 

,0639 

,0339 

,0161 

,0068 

,0025 

,0008 

,0002 

,0000 

,0000 

,0000 

,0000 

,0000 

,0173 

,0852 

,1720 

,2362 

,2581 

,2397 

,1954 

,1419 

,0923 

,0537 

,0277 

,0125 

,0048 

,0015 

,0004 

,0001 

,0000 

,0000 

,0000 

,0021 

,0213 

,0683 

,1329 

,1936 

,2311 

,2367 

,2128 

,1700 

,1208 

,0762 

,0420 

,0199 

,0078 

,0024 

,0005 

,0001 

,0000 

,0000 

,0002 

,0038 

,0193 

,0532 

,1032 

,1585 

,2039 

,2270 

,2225 

,1934 

,1489 

,1009 

,0591 

,0291 

,0115 

,0033 

,0006 

,0000 

,0000 

,0000 

,0005 

,0040 

,0155 

,0401 

,0792 

,1281 

,1766 

,2124 

,2256 

,2124 

,1766 

,1281 

,0792 

,0401 

,0155 

,0040 

,0005 

,0000 

,0000 

,0000 

,0006 

,0033 

,0115 

,0291 

,0591 

,1009 

,1489 

,1934 

,2225 

,2270 

,2039 

,1585 

,1032 

,0532 

,0193 

,0038 

,0002 

,0000 

,0000 

,0001 

,0005 

,0024 

,0078 

,0199 

,0420 

,0762 

,1208 

,1700 

,2128 

,2367 

,2311 

,1936 

,1329 

,0683 

,0213 

,0021 

,0000 

,0000 

,0000 

,0001 

,0004 

,0015 

,0048 

,0125 

,0277 

,0537 

,0923 

,1419 

,1954 

,2397 

,2581 

,2362 

,1720 

,0852 

,0173 

,0000 

,0000 

,0000 

,0000 

,0000 

,0002 

,0008 

,0025 

,0068 

,0161 

,0339 

,0639 

,1088 

,1678 

,2323 

,2635 

,2924 

,2301 

,0988 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0001 

,0003 

,0010 

,0029 

,0075 

,0174 

,0368 

,0712 

,1267 

,2062 

,3012 

,3766 

,3413 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0000 

,0001 

,0002 

,0008 

,0022 

,0057 

,0138 

,0317 

,0687 

,1422 

,2824 

,5404 
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FORMULAS 


TA LA rmulasapli a asenlasme i as eposi i n ispersi n asimetr ay apuntamiento 


MEDIDAS DE POSICION O TENDENCIA CENTRAL 


1. Media aritmetica 

£*, 


a. x = ■ 


b. y = O t + 


£ w 


c. y = O t + C 


£ z"n. 


— £ y n 

d. y = 


e. y = £y,A 


n 

2. Mediana 

A. Variable discreta 

a. Nl < + 

j-i 2 e 2 

b. Nj _ 1 <^^M e = y i 

B. Variable continua 


a - W j 21 5 y ^ 5 y' 2 i 

b. W J21 , 5y; 21 lC 

C. Datos no agrupados 
n + 1 


n/2-N^ 


■ Posicion de la observacion central 


3. Modo 


a. M, 5 y. b. M, 5 K. 1 C 

<7 7 d 7 21 


;+i 


n ^ + n. . 

7+1 7-1 


c. M d 5r 21 lC 


d. M d 5K. 21 lC 


e - M d SY J21 lC 


~ n ;-i 


( n .- n y _ i )+( n y - n . + i ) 


n . - - n. . 

_7+1 7-1_ 

2(2n. - n. . 

V 7 7-1 7+1 / 


n. . - n .^ 
7-1 7+1 


n . + n + n . 

7 7+1 7-1 


2 I S Y 2 n. 

4. Media cuadratica M = ^~ = . 


YX 3 IT Y 3 n. 

5. Media cubica M, = , 3 / 1 ■ M 3 = ?'■ 


6. Media armonica M = - M-i - =—— 

Ei / x . ^ n i 7 


n 

n 


7. Media geometrica 
a. M n = 


b. M 0 = :fdT' 


c. log M 0 = 

d. log M 0 = 


£ log X, 
n 

£ ", log v 2 


8. Cuartil, decil, percentil 
a. Q 3 5K 21 1C 


— - N 
4£± 

n 


b. D 5 5V J21 1C 


o C 60 5 K 21 1C 


A. Desviaciones 


— - A/ 

io£l 

n. 


Tercer cuartil 


Quinto decil 


60 " - A / 

100 ■ y ~ 1 

n. 


Sesenta percentil 


a. z.5x.2x; z.5y ( .2y; b. z'.5y.20 f ; c. z" 
B. Propiedades de la media 
a. M m = /C 

b - M [ k + *] = K + M [ x ] = K + x 

o M h =/ CM m = / Cx 
d ^ _ Xi!\ + X 2 n 2 


y, ~ °, 


"i + " 2 

e. M r -, = Mr — k = x- K 

[x-K] [*] 

f. £ z = O = O 

g. £ zfn < £ z. 2 n ; 

Otras propiedades 

a. x = M = M, Simetrica 

_ 0 0 

b. x > M > M' Asimetrica 1 

_ O 0 

c. x < M < M. Asimetrica 2 

O 0 

C. Propiedad de la Me 

£|v:-M e |n,<£|K-O t 

D. Propiedad 

M_ x < M 0 < M ± < M 2 < M 3 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA rmulasapli a as en las me i as eposi i n ispersi n asimetr a y apuntamiento. 

Continua i n. 


MEDIDAS DE DISPERSION 


1. Varianza 


a. S 2 = 


b. 5 2 = 


IV 


n n 

-2 


£ xf - nx 


c. S 2 = 


2 _ X Z A 


S 2 = 


X X 2 -2 
-— - X 


IM) 2 ", 


, c2 Xy, 2 "; - 2 

d. s =-— - y 


S 2 = 


£ Y 2 n i - nY 


e. S 2 = 


f. S 2 = C 2 


_ _ r iv ,- 


\2 


Z z v, _ r iv,- 


\ 2 


n 

v y 


2. Desviacion tipica o estandar 
S = +y[s r 

3. Desviacion media 

£ \z\ xk-y| 


a. D =■ 


n n 

£|z|d. X|y,-yk 


b. d = 

n n 

4. Desviacion mediana 

£| x ,.- M ,| 


a. D 




n 


5. Coeficiente de variacion 

J >_ = J >_ 

X Y 


CV = d = -L = -L 


6. Puntaje tipico t = ■ 


X-X 


7. Limites 

8. Recorrido Rango 5 X M . x 2 X Mn 


Y±Z * V 

Y 


9. Recorrido intercuartflico: 
Qd ^ Q 3 2 Q , 

10. Desviacion cuartil: 


q d = 


Qb - Qi 


■° 2 

11. Coeficiente de desviacion cuartil: 


CQ = ^ 


+ Ql D 

12. Coeficiente de desviacion media: C n = 

X 

A. Propiedades de la varianza 


a. S 2 .0 


b. V [lq 5 0 


c- d. Vi 5 ^! 5 ^ 2 

S 2 n 1 + S 2 n 2 (X,- n 1 + {x 2 - X ) 2 n 2 


f. S 2 = 


n i + n 2 


n i + n 2 


B. Propiedades 

a. S.DjD e 

b. D a 5 0,79795 (en la distribucion simetrica) 

C. Momentos unidimensionales 
Momentos bidimensionales 

a. Momentos respecto variable 

£ Y'n £ X k, Y 2 h n 

a, = - 1 ' • a = - 


b. Momentos respecto a X 

£ Z r n £ £ 2* Z* n 

m = --—— ; m = - 1 

n ' vi n 

c. Momentos respecto O f 

. £ZV ££Z^n 

m =- 1 —-• m = - i 


d. Momentos respecto a O f en unidades de C 

. £ Z'.'n. XX^n.. 

m =- - —- m = - -— 2 —^~ 


MEDIDAS DE ASIMETRIA 


MEDIDAS DE APUNTAMIENTO 


X-M, 
a. A =- d - 


b. A = 


i(x-M e ) 


Q, + Q - 2M 

c . B = 3 1 


Qb - Qi 

A . 0 Asimetrica 1 
A , 0 Asimetrica 2 


m 

d V = 

A 5 0 Simetrica 1 


m q 

a. 2 2 =—T 
m 2 

g 2 .3 Apuntada o 
leptocurtica 

g 2 , 3 Achatada o 
platicurtica 


g 2 , 3 Achatada o 
platicurtica 

g 2 5 3 Normal o 
mesocurtica 
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TA LA I rmulasapli a asen la Regresi ny orrela i n 


REGRESION Y CORRELACION LINEAL SIMPLE Y PONDERADA 


1. Ecuacion general (regresion simple) 

Y = b y ,{ X - x ) + Y 


a. Y = b yx X + C yx 


b. X = b xy [ v - Y ) + X X = b xy Y + C xy 


Z X = b Z 

xy y 


2. Coeficiente angular 
m 

a - = 

b - z . = b v [ Y - Y ) 


Zy = bZ„ 


b = 

xy 52 


Zy = 


C . b vu = 


* Z * Z y 


b „ = 


= b A x ~ x ) 

iz 2 




b M = 


" Z * 2 ;_(!>)' 

Z xy - nxy 


b = 


Z x 2 - nx 

3. Coeficiente de posicion 

c L 


”2> 2 -(Iy) 
Z*y-n*y 
S y 2 - «y 2 


Cxy=X-b xy Y 

Zx-bYy 


c = - 


Covarianza 

Z^K 


a. ™ =■ 


-XK 


4. Sistema de ecuaciones 
a. £V' = b y ,IX+ n C r „- 

'LXY = b yx '£ x 2 + c yx ' ZX ; 

5. Varianza residual 

iMf 


sv, 

m =-— 

* n 

b. ZX = b xy £Y+ n C lv 
T,XY = bYY 2 + CYY 


a. S = - 


s 2 =- 




b. Si = s;; - - 


n 

m 2 


n 

m 2 

_ X? 

S 2 


c. si 


d. s 2 




s: y = s ; 

nz .- z - 


si, = 


^- c ^ Y - b^xr 


sy - c v Ex ,.-^ sxy . 


^ S ^ i - R 2 ) 


^ = S 2 (1-R 2 ) 


6. Error estandar 

a - s „ = +fiT 

7. Varianza explicada 

z(M 2 


s = + Js; 


a. s 2 


b . S 2 = 


Si, = s - Si 


Z(*-*)‘ 


si = s ^ - s ^ 


8. Covarianza (ponderada) 
2 Z x Z y n i 


a. m - 


Z x.ya 


-XY 




9. Varianza total 


S 2 = S 2 + S 2 ; 

x xy ax' 


VTSVR1 VE 


10. Coeficiente de correlacion 


R 2 = - 


a. R 2 = ^; 
r = —^ = Jb *~ b ~ 

55 V yx xy 


s 2 s 2 

b . R 2 = 1 - = 1 - - Z -; 

S 2 S 2 


VR 

VT 


C. R 2 = — j ^ y'i 
S 2 S 2 




R 2 = 


VE 


VT 

21 # r # 1 


ZK 

0#R 2 # 1 

11. Regresion lineal ponderada 

Y = b X + C ] X = b Y + C 

yx yxi xy xy 

12. Sistema de ecuaciones (ponderada) 

a- S>'n i = VSM + "^ 
b- + 

EW , = b xy EV ? n , + C v Etyi , 

13. Varianza residual (ponderada) 

E^, - ^ YXi n i - by, EW n i 


a. S 2 = ■ 


si = 


b. S 2 = 


E * 2 ", - C „ ZX , n , - 6 


Zfr-?') 2 "' 


s 2 = 


I n, 
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CIRO MARTINEZ BENCARDINO 

ESTADISTICAY MUESTREO 


TA LA I rmulasapli a asen la regresi ny orrela i n. Continua i n 


1 . 


2 . 


3. 


4. 


5. 


6 . 


REGRESION PARABOLICA SIMPLE Y PONDERADA 


Ecuacion general (regresion simple) 
a. Y = o X 2 + b X + C 

yx yx yx 

b. X = a v Y 1 + b v Y + C v 
Sistema de ecuaciones 
a. XY,=o yx 'LX 2 l +b yx 'ZX i + nC yx 
Zxy^a^xf + b^xf + c^x, 

T.X?Y, = a yx ZX, 4 + b yx ZXf + C yy IX, 2 
b- ZX i =a yy ZY, 2 + b xy ZY l + n C xy 

IXy^a^Y' + b^Y^ + C^Y* 

Sistema de ecuaciones (ponderada) 

a. Zty»,- = a yx T,Xp, + b^Z Xp, + nC^ 

'LY.,Xp i = a yx SXm, + b yx '£Xp, + C yx ^Xp, 
ZV'Xm. = Qyx Z Xp, + by, ?,Xp, + C^ Xp, 

b. IX n = 0yy ZYp +b xy X Yp. + nC xy 

Z X i Yp i = a xy "ZYp, + b xy ’Z Yp, + C xy "ZYp, 
Z XYp. =a xy ^ Yp + b xy XYp + C^Z Yp 

Varianza residual (simple y ponderada) 

„ r2 _ 2^ - c^E y. - b w xxr - 0yx E*fr 

a ‘ ^ n 

s2 _ ZX 2 i -C xy ZX i -b xy ZXY i -a ><y ZY 2 i X i 
19 n 

u 2 _ I,X*n. - C y YyXp. - b xy I Y.X.n. - a xy E Y 2 X.n. 

U ‘ n 

2 _ Y . Y]n - C ^ Yp - b ^ XYp - a ^ X 2 ^ 

yx n 

Coeficiente de correlacion 


r = . 1 


fk - 

S y ' 

Limites de confianza 

s.„ ^ Ys 


r = J 1- 


Y±Z 




< 


x±z 




Y±Z 


1 + - + - 


M 


zx;- 


(zz 




REGRESION Y CORRELACION MULTIPLE 


1. Ecuacion general 

a. Xi = b 123 + b 123 X 2 + b 132 X 3 

b. Xi — b 213 + b 213 X 3 + b 231 X 3 


c Xi - b 3U + b, 12 X 1 + b 321 X 2 

a. Xi = b 123 (x 2 - X 2 \ + b 132 (x 3 - X 3 ) + Xi 

b. x 2 = b 21 3(x y - Xi ) + t > 231 (x 3 -x 3 ) + x 2 
C. Xs = f> 312 (x,-Xi) + f> 32 2 (X 2 -X 2 ) + Xb 

2. Sistema de ecuaciones normales 

a. Z X 2 = nfa, 23 + b 12 3 Z X 2 + b 132 Z X 3 

ZX 2 X 2 = b 123 zx 2 + b 123 z x| + b 132 zx 3 x 2 
Zx,x 3 = b 123 zx 3 + b 123 Z x 2 x 3 + b 132 zx 

a. Zx 2 z 2 = b 123 zx 2 + b 132 Z z 3 z 2 

W 3 = b 123 z 2 z 3 + b 13 2 Zz 3 

b. Z X 2 = nb 2 13 + b 21 3 Z Xj + b 23 j Z X 3 
zx,x 2 = b 213 zx 2 + b 213 zx; + b 231 z X 3 x 2 
ZX 2 X 3 = b 213 zx 3 + b 213 zx 2 x 3 + b 231 zx; 

b. Zz 2 z 1 = 6 213 zz; + 6 231 zz 3 z 1 

Zz 2 z 3 = f> 213 zz i z 3 + f> 231 zz; 

c. Z X 3 = nb 3 12 + & 312 Z X 2 + t > 32 2 Z X 2 
ZX 3 X 3 = b 312 zx, + fa 312 z x; + b 321 zx 2 x 2 
zx 3 x 2 = b 312 zx 2 + z b 3 , 2 ZX 3 X 2 + b 321 z x; 

c. Zz 3 z 1 = fa 312 zz; + f> 32 i zz 2 z 1 
Zz 3 z 2 = b 312 zz 1 z 2 + fc 321 zz; 


VR 

VT 


3. Varianza residual 


, y 


Z X 3 -Xi 


Z X 3 -Xs 


Z x 2 -x 2 


4. Desviaciones 

z x = - Xi; z 2 = x 2 - z 2 ; z 3 = z 3 - Z 3 

5. Coeficiente de correlacion 
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TA LA II rmulasapli a as en las Series etiempo 


SERIES CRONOLOGICAS - TENDENCIA 


I. Ajuste rectilmeo 

1. Ecuacion general 

Y = bx + c 

2. Sistema de ecuaciones 

| Y Y = b 'L x+nc 

cuando £x * ? 2 + c ^ x 

3. Calculo de by c 

cuando Yx = 0<b = ; c =- 

1 2 > " 

4. Estimativos mensuales 

A. Valores anuales correspondientes a 
sumas mensuales 

a. Y = -^—X + — (impar) 

144 12 K 

b. Y = — X + — (par) 

72 12 K 

B. Valores anuales correspondientes a 
promedios mensuales 

a. Y = + c (impar) 

b. Y = —X + c{par) 

6 

5. Otras ecuaciones 


Y = Y + 


Yx 2 

6. Coeficiente de correlacion 

nYXY-YxYl 

[nX^-(Xx) 2 ][nX^-(Xr) 2 


S 2 = —--— varianza residual 

yx n 

7 E Y 2 - 2 

S =-- Y varianza total 

y n 

(ver S yx tab la XVII) 


II. Ajuste parabolico 

1. Ecuacion general: Y = ox 2 + bx + c 

2. Sistema de ecuaciones 
^Y = a'ZX 2 + b'ZX+nc 

'ZXY = a? J X 3 + bZX 2 + c'ZX 
£X 2 / = a £X 4 + b £X 3 + C £ X 2 
(cuando ^X * 0) 

3. Calculo de a, b y c (cuando ^X = 0) 
T.XY 


b = - 


EX 2 

£X 2 X = a£X 4 + c£ X 2 

4. Otras formulas 
£Y-a£X 2 


nYX 2 Y - Y X 2 YY 

a = -———— 


S' / = aE X 2 + nc 


nY ^~{ YX 2 


y X/ 

b = ——— (cuando ^X = 0) 

E X 

5. Coeficiente de correlacion 


r = . 1 


La S 2 yx para la parabola aplicar for¬ 
mula de la tabla XVII 

III. Ajuste exponencial 

1. Ecuacion general 

a. Y = cb x b. log YS log c 1X log b 

2. Sistema de ecuaciones 
(cuando ^X * 0) 

^log Y = n log C + (^X)log b 

Yx\og Y = (Xx)log C + (Xx 2 )log b 

3. Calculo de c y b (cuando £x = 0) 

E Xlog Y 


log b = - 


£logc 


E x 2 
E log Y 


4. Coeficiente de correlacion expo¬ 
nencial 


a. r = . 1 - 


Siendo 


J^log Y - log 1 


Para S 2 x y S 2 ver tabla XVII 

IV. Exponencial modificada 

Y = K+cb x 

V. Curva de Gompertz 

Y = K-C b ' 

log Y 5 log K 1 1? log a 

VI. Logfstica 

1 


Y=- 


K+cb x 


VII. Estimation de P. 


a. P f 5 P ( .(l 1 r) x 


b. log(l 


+ r = 


log P f - log P. 


VIII. Limites de confianza 

Vn 


Elaborado por: 

Ciro Martinez Bencardino 
Ecoe ediciones 
Apartado aereo 30969 
Tels.: 2889871/21 
Bogota, D.C 
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TA LA III rmulasapli a asenlosN meros n i es. 


NUMEROS INDICES 


1. Indices simples 

a. l‘„ = — x 100 

° 

b. /; = — x ioo 

P o 

X t 5 investigado 
X 0 5 base 

2. Indice agregativo simple 

y x 

a. P c x 100 
° 1*0 

y p 

b. l' = x ioo 
0 EP„ 

c. /' = x ioo 

S <7o 

. ,, I G 
d |» = — 

3. Indice ponderado de precios 

a. Laspeyres 

6 = ^ Pfq ° x ioo 
E ^ 0 

b. Paasche 




po _ 


I P o<7 ( 

c. Fisher 

f '° = ^ + P '° 

d. Sidgwick 

^ + p'o 


X100 


e. Keynes 

lt YP minirno (q-q t ) 

k° = 4^ - y° Ht [ x ioo 

Z P o minirno (q 0 -q t ) 

f. Marshall 

a _ SP,( c /o + <7 t ) 


M'" = - 


x 100 


Z P o( £ ?o + <? t , 

g. Walsh 

W 4 = ^ P ' V‘ ? o + <? L X 100 
I p „V<7o + <7, 


4. indices ponderados de cantidad 
a. ^ ^ 0<?t x 100 


b. p Ji 


S P o<7o 

SP,<7, 

Z p t 4 0 


X 100 


F J '° p 

6 + p'° 


A 


d. = 


, Yn minirno (P-P) 

e. K j ° = 4^ - ) 0 xioo 

minirno (P 0 -P,) 


M J '° = ^ q '( P ° +Pt ) x 100 

I<7o( p o+ p t ) 


M/' :; = £<? ^ P ° + P C X 100 

2 4oV P 0 + p t 


Examen de las formulas 

a. Reversibilidad temporal 

p'° x p'° t 1 
P° x P° t 1 
p'o X p'° = 1 

b. Reversibilidad factores 

F J ° Xf '^ l /-^ PfC7f 


E p 0 q 0 

6 xL Jt ° tv 

K l ° XK J ° T V 

6. Indice de valores 

E P t q t _ v t 


p'o x p'5| i/ 

M 'o xM J »tl/ 


a. V = 


E P 0 q 0 


v n 


b. VSP'3L J 

c. V 5 /.' 3 P / 

7. Otras formulas 
Porcentaje de alza 


a. % alza 5 100 




Indice poder adquisitivo 


b. I.PA = 100 


/n 


c. % desvalorizacion 5 100 


x ~i 


d. % alza 5 100 


i-1 

T n 


e. % devaluacion 5 100 


i -^ 

T 


f. I. de produccion 

I.P.= produccion 
IPC 

g. I. de productividad 

lp = iproduccidn X10Q 
I. obreros 

h. Salario real 

_ „ S. nominal 

S.R. =-x 100 

IPC 

S.R. 5 PA (Salario nominal) 

i. Poder adquisitivo 

PA = — x 100 
IPC 


Relacion neta de cambio 
IVUX 


R = - 


- x 100 


IVUM 

k. Capacidad para importar 
CM 5 R 3 IQX 

IVUX 5 Indice de valor unitario de 
exportacion. 

IVUM 5 Indice de valor unitario de 
importacion. 

IQX 5 Indice quantum de 
exportacion. 
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TA LA 


IV 


rmulasapli a asenlalneren iaesta sti a 


PROBABILIDADES 


DISTRIBUCIONES 


1. Probabilidades 
p _ x _ exitos 


0#P# 1 


n total casos 
PlqSl 
2. Propiedades 

a. Mutuamente excluyentes 
(aditiva) 

P{A oB) 5 P{A < B) 5 P{A) 1 P{B) 

b. Eventos solapados 

P{A < B) 5 P(A) 1 P{B) 2 P(A > £) 

c. Eventos complementarios 

p ( f ) =1 - p ( f ) 

d. Eventos independientes 
P{A > B) 5 P{AB) 5 P(A)P(£) 

e. Probabilidad condicional 
P(AnB) 


P(A/B ) 
P(B/^) = 


p(e) 

P[BnA) 


P(A) 

f. Formula de Bayes 

, v P(A) P(E/A ) 
p(A/E)= v 7 ^ 

v ; p ( E ) 

p(s) p(£/fl) 


P[B / E) = - 


P \B) 

a. Combinaciones 

C” =_—_ 

r (n-r)\r\ 

b. Permutaciones: Pn 5 n\ 

c. Variaciones 

n! 

r ("-O' 

d. Permutaciones con repeticion 


P = (r r r ) =-j— 

n V 1 2 3 / r | r | r | 


Distribucion binomial: P x = C x p x q n 
Distribucion de Poisson 

X x e~ x 


P = - 


x\ 


e 5 2,71828 I 5 np 

Esperanza matematica: E 5 np 
Juego equitativo 
Apuesta 5 (Prob. exito) (Premio) 
Premio 5 Apuesta 5 Ganancia 
Ecuacion de la curva normal 
p 5 3,1416 e 5 2,71828 
Funcion de densidad 


v 1 [x ~ u 

Y = — 


P = 


ctV2tt 2ct 2 

Cuando m 5 0 y s 5 1 

v 1 - Z 2 

Y = I_ e - 

VZrT 2 

m 5 np (media dist. binomial) 
a = jnpq (Desv. dist. binomial) 
Modelo hipergeometrico: 
kVn-K 

x II n - x 


5. Variante estadistica 
a. Distribucion normal: Z = 


X - (JL 


Dist. de medias muestrales 


z = 


X (JL 


p -- = 




z = 


X- (JL 


5- = - 


S - ' x >fn 

Dist. de diferencia x - y 

{x-y)-(p,-p y ) 


z = 


n , n . 


^z- = ^ x -\^ y 


i 2 i 2 

a- - — la — + a — 


6. Distribucion muestral de una 
proporcion 

z = - p - p 


P 5 mip; p = j-; <x p j| Jpq 

7. Distribucion de diferencias 

(Pi —P 2 ) —(m- P i - nj 


Z = - 


PA 


n i n 2 

8. Distribucion "t" de Student n # 30 


a. t = - 


x- |X 


t = 


X - |JL 

s/4n 


S = s 



III 

M 

n • 5 — J 

I"- 1 ' 1 

n - 1 


z= ( x -^)-K-P-r) 


s __ = [ ( n i- 1 ) 5 » + ( n 2 - 1 ) 5 y l-L + .l 


S - - =. + —— 

x “ y V n, n. 


+ n 2 - 2 

E+l 

b. Funcion / = cj\ + —j 

9. Distribucion y'/'-cuadrado 


10. Observaciones apareadas 

.. . d - a- 

a. Variante z ot = -- 


b - S = 




n - 1 


c S - = d 
Vn 
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TA LA IV rmulasapli a asenlalneren iaesta sti a.Continua i n 


MUESTREO 


1. Muestreo aleatorio 
A. Tamano muestral (promedios) 
z 2 S 2 N 


a. n = - 


E N + z 2 s 2 


b . n = - 


NS 


ii + ii 

N 

1 + U °. 

N 


E 2 + N 2 S 2 


z S 
E 2 

N 2 z 2 s 2 


n n = (promedios) 


W 2 ? 2 c 2 

n n = — (totales) 


z 2 s 2 

d. n = (poblacion infinita) 

B. Limites de confianza 
s \ N — n 


Y\ = y±z 




N 


Yj = Ny±z- 


Ns N - n 


■vM N 

2. Metodos proporciones 

A. Tamano muestral (proporcion) 

z 2 NPQ PQ 

a. n = — -f— = —— - 

E 2 N + z 2 PQ E 2 PQ 


N 


b. n = PC ^ (proporcion) 


N 2 PQ 


E 2 N 2 PQ 

z 2 N 


(totales) 


B. Limites de confianza 


pq N-n 

p s = p± zJ-^- 2 - J- 

H V n V N-l 


A s = Np ± znJ22- ——- 

1 H V N \N-l 

3. Estimacion por razon 

a. Tamano de la muestra 

z 2 s 2 

n = _ R 


1 + - 


N 


b. Limites de confianza R* = R ± zy[v\R\ 

c. Varianza estimada 


^i = - 


1 -f 


Y J y 2 ~2RY J xy + R^ 


n-l 


d. Razon estimada 

5 = ^ = 1 

Z* x 

e. Razon (poblacion) 

T.Y _ Y _Y 
Z * x x 

4. Muestreo estratificado 
A. Afijacion igual 
a. Tamano muestra (totales) 

y N 2 h S 2 h 


R = - 


(E/Z) +^N h S 2 h 

b. Tamano muestra (promedios) 
1 v 1 


( E / z ) 


W h 


i +— 

N(E/Z) 

n N£Z 

NE 2 + Z 2 £ W h S 2 h 

c. Media muestral estratificada 


- Z N h Y* 

y ct =--—; 

yst N ' 

d. Varianza estimada 

(promedios) 


/- = i 




V 


[?.] = £ 




e. Limites de confianza 


Y = y st ±z V f ,. 


Y = Ny st 


B. Afijacion proporcional 
a. Tamano muestra (totales) 

„ _ I 


z Na 


(E/Z) 

b. Tamano muestra (promedio) 

c. n-- 

(£//)' 

d. Tamano en cada estrato: 


1 + 


n h SW h (n) 


w=- 


N „ 


d. Media muestral estratificada 
y st = Z w h y h 
f. Varianza estimada 
. N-n 


^ r ■ 

M 


n n 

N-n 


n 


HN h S 2 h 


g. Limites de confianza 

h =~ y ^ ± t K ] 


Y st = Ny s ,±t . 




C. Afijacion optima 
a. Tamano muestra 


C-C 


1. n = 

2. n = - 

3. n = 

4. n = - 

5. n = - 


y 


c-cJ 






G>A) 


(£/z) 2 + XnA 
(Z w A ) 2 

( £ / z ) 2 + ^ I w A 

b. Tamano en cada estrato 


1 . a = n |- A/ ^- 


(totales) 

(general) 


2. n = 


X W A 




y. w„s„ 


c. Varianza estimada 


V - 


L^J n N 

d. Limites de confianza 

^ = Yst ± 

= /Vy sf ± tNJv\^] 
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Se Mega con esta publicacion a la decima tercera edicion, en varias ocasiones con 
reimpresiones, lo cual indica su gran aceptacion durante sus 32 anos de vigencia en el 
mercado educativo. Cada edicion ha estado sujeta a una rigurosa depuracion, revision y 
enriquecimiento continuo, a fin que su contenido se mantenga actualizado y acorde a las 
necesidades tanto de alumnos como de profesores. 

Los 13 capitulos se distribuyen asi: los cinco (5) primeros, corresponden a la Estadlstica 
Descriptiva, que incluye aspectos metodologicos y definiciones sobre terminos basicos; 
elaboracion de tablas de frecuencias, cuadros de informes y graficas que permiten visualizar 
la informacion; interpretacion de los datos por medio de la aplicacion de medidas de posicion 
(promedios), de dispersion, asimetria y apuntamiento. Los cinco siguientes, hacen referencia 
a la inferencia estadlstica e incluyen los elementos basicos de probabilidad, distribuciones 
muestrales, pruebas de hipotesis, llmites de confianza, distribuciones no paranefricas, Chi 
cuadrado, Distribucion F, etc. La tercera y ultima parte esta dedicada a los numeros Indices, 
series de tiempo, regresion y correlacion simple y multiple (rectillneo, parabolico y 
exponencial), incluyendo al final los elementos teoricos y las aplicaciones practicas de los 
diferentes metodos de muestreo aleatorio y no aleatorio. 

Ademas, se proponen aproximadamente mil 300 ejercicios, sin contar con un sinnumero de 
ejemplos, cuyas soluciones, procesos y respuestas, estan disponible en el Sistema de 
Informacion en Llnea - SIL. Durante el desarrollo de la teorla, se explica el uso de Excel y la 
aplicacion de las diferentes calculadoras, que permiten agilizar los calculos. Contiene un 
resumen de formulas, glosario y tablas que seran utilizadas con la aplicacion de estos 
contenidos 
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